Code

lyrics: use open-uri to handle HTTP 301 redirection
[ncmpc.git] / lyrics / 20-lyricwiki.rb
1 #!/usr/bin/env ruby
2 #
3 #  (c) 2004-2008 The Music Player Daemon Project
4 #  http://www.musicpd.org/
5 #
6 #  This program is free software; you can redistribute it and/or modify
7 #  it under the terms of the GNU General Public License as published by
8 #  the Free Software Foundation; either version 2 of the License, or
9 #  (at your option) any later version.
10 #
11 #  This program is distributed in the hope that it will be useful,
12 #  but WITHOUT ANY WARRANTY; without even the implied warranty of
13 #  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14 #  GNU General Public License for more details.
15 #  You should have received a copy of the GNU General Public License
16 #  along with this program; if not, write to the Free Software
17 #  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 #
20 #
21 # Load lyrics from lyrics.wikia.com, formerly lyricwiki.org
22 #
24 require 'uri'
25 require 'open-uri'
26 require 'cgi'
28 # We need this because URI.escape doesn't escape ampersands.
29 def escape(string)
30         new = URI.escape(string)
31         new.gsub(/&/, "%26")
32 end
34 url = "http://lyrics.wikia.com/api.php?action=lyrics&fmt=xml&func=getSong" + \
35     "&artist=#{escape(ARGV[0])}&song=#{escape(ARGV[1])}"
36 response = open(URI.parse(url)).read
38 if not response =~ /<url>\s*(.*?)\s*<\/url>/im
39         $stderr.puts "No URL in response!"
40         exit(1)
41 end
43 url = $1
44 exit(69) if url =~ /action=edit$/
46 response = open(URI.parse(url)).read
47 if not response =~ /<div class='lyricbox'>\s*(.*?)\s*<!--/im
48         $stderr.puts "No <div class='lyricbox'> in lyrics page!\n"
49         exit(1)
50 end
52 if not $1 =~ /^.*<\/script>(.*?)$/im
53         $stderr.puts "Couldn't remove leading XML tags in lyricbox!\n"
54         exit(1)
55 end
57 lyrics = $1.gsub(/<br \/>/, "\n")
59 if lyrics.respond_to?(:force_encoding)
60   puts CGI::unescapeHTML(lyrics.force_encoding(Encoding::UTF_8))
61 else
62   $KCODE = 'U'
63   puts CGI::unescapeHTML(lyrics)
64 end