Code

20-lyricwiki.rb: recode recieved lyrics
[ncmpc.git] / lyrics / 20-lyricwiki.rb
1 #!/usr/bin/env ruby
2 #
3 #  (c) 2004-2008 The Music Player Daemon Project
4 #  http://www.musicpd.org/
5 #
6 #  This program is free software; you can redistribute it and/or modify
7 #  it under the terms of the GNU General Public License as published by
8 #  the Free Software Foundation; either version 2 of the License, or
9 #  (at your option) any later version.
10 #
11 #  This program is distributed in the hope that it will be useful,
12 #  but WITHOUT ANY WARRANTY; without even the implied warranty of
13 #  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14 #  GNU General Public License for more details.
15 #  You should have received a copy of the GNU General Public License
16 #  along with this program; if not, write to the Free Software
17 #  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 #
20 #
21 # Load lyrics from lyrics.wikia.com, formerly lyricwiki.org
22 #
24 require 'uri'
25 require 'net/http'
26 require 'cgi'
27 require 'iconv'
29 url = "http://lyrics.wikia.com/api.php?action=lyrics&fmt=xml&func=getSong" + \
30     "&artist=#{URI.escape(ARGV[0])}&song=#{URI.escape(ARGV[1])}"
31 response = Net::HTTP.get(URI.parse(url))
33 if not response =~ /<url>\s*(.*?)\s*<\/url>/im
34         $stderr.puts "No URL in response!"
35         exit(1)
36 end
38 url = $1
39 exit(69) if url =~ /action=edit$/
41 response = Net::HTTP.get(URI.parse(url))
42 if not response =~ /<div class='lyricbox'>\s*(.*?)\s*<!--/im
43         $stderr.puts "No <div class='lyricbox'> in lyrics page!\n"
44         exit(1)
45 end
47 if not $1 =~ /^.*<\/div>(.*?)$/im
48         $stderr.puts "Couldn't remove leading XML tags in lyricbox!\n"
49         exit(1)
50 end
52 # lyrics come in Latin1, but we need UTF-8
53 lyrics_latin1 = CGI::unescapeHTML($1.gsub(/<br \/>/, "\n"))
54 puts Iconv.conv('UTF-8//TRANSLIT//IGNORE', 'Latin1', lyrics_latin1)