]> git.netwichtig.de Git - user/henk/code/ruby/rbot.git/blob - data/rbot/plugins/rss.rb
rss plugin: 0.9 feeds don't work, so we just patch them to pretend they are actually...
[user/henk/code/ruby/rbot.git] / data / rbot / plugins / rss.rb
1 #-- vim:sw=2:et\r
2 #++\r
3 #\r
4 # :title: RSS feed plugin for rbot\r
5 #\r
6 # Author:: Stanislav Karchebny <berkus@madfire.net>\r
7 # Author:: Ian Monroe <ian@monroe.nu>\r
8 # Author:: Mark Kretschmann <markey@web.de>\r
9 # Author:: Giuseppe Bilotta <giuseppe.bilotta@gmail.com>\r
10 #\r
11 # Copyright:: (C) 2004 Stanislav Karchebny\r
12 # Copyright:: (C) 2005 Ian Monroe, Mark Kretschmann\r
13 # Copyright:: (C) 2006-2007 Giuseppe Bilotta\r
14 #\r
15 # License:: MIT license\r
16 \r
17 # require 'rss/parser'\r
18 # require 'rss/1.0'\r
19 # require 'rss/2.0'\r
20 # require 'rss/dublincore'\r
21 # # begin\r
22 # #   require 'rss/dublincore/2.0'\r
23 # # rescue\r
24 # #   warning "Unable to load RSS libraries, RSS plugin functionality crippled"\r
25 # # end\r
26 #\r
27 # GB: Let's just go for the simple stuff:\r
28 #\r
29 require 'rss'\r
30 \r
31 class ::RssBlob\r
32   attr_accessor :url\r
33   attr_accessor :handle\r
34   attr_accessor :type\r
35   attr :watchers\r
36   attr_accessor :refresh_rate\r
37   attr_accessor :xml\r
38   attr_accessor :title\r
39   attr_accessor :items\r
40   attr_accessor :mutex\r
41 \r
42   def initialize(url,handle=nil,type=nil,watchers=[], xml=nil)\r
43     @url = url\r
44     if handle\r
45       @handle = handle\r
46     else\r
47       @handle = url\r
48     end\r
49     @type = type\r
50     @watchers=[]\r
51     @refresh_rate = nil\r
52     @xml = xml\r
53     @title = nil\r
54     @items = nil\r
55     @mutex = Mutex.new\r
56     sanitize_watchers(watchers)\r
57   end\r
58 \r
59   def dup\r
60     @mutex.synchronize do\r
61       self.class.new(@url,\r
62                      @handle,\r
63                      @type ? @type.dup : nil,\r
64                      @watchers.dup,\r
65                      @xml ? @xml.dup : nil)\r
66     end\r
67   end\r
68 \r
69   # Downcase all watchers, possibly turning them into Strings if they weren't\r
70   def sanitize_watchers(list=@watchers)\r
71     ls = list.dup\r
72     @watchers.clear\r
73     ls.each { |w|\r
74       add_watch(w)\r
75     }\r
76   end\r
77 \r
78   def watched?\r
79     !@watchers.empty?\r
80   end\r
81 \r
82   def watched_by?(who)\r
83     @watchers.include?(who.downcase)\r
84   end\r
85 \r
86   def add_watch(who)\r
87     if watched_by?(who)\r
88       return nil\r
89     end\r
90     @mutex.synchronize do\r
91       @watchers << who.downcase\r
92     end\r
93     return who\r
94   end\r
95 \r
96   def rm_watch(who)\r
97     @mutex.synchronize do\r
98       @watchers.delete(who.downcase)\r
99     end\r
100   end\r
101 \r
102   def to_a\r
103     [@handle,@url,@type,@refresh_rate,@watchers]\r
104   end\r
105 \r
106   def to_s(watchers=false)\r
107     if watchers\r
108       a = self.to_a.flatten\r
109     else\r
110       a = self.to_a[0,3]\r
111     end\r
112     a.compact.join(" | ")\r
113   end\r
114 end\r
115 \r
116 class RSSFeedsPlugin < Plugin\r
117   BotConfig.register BotConfigIntegerValue.new('rss.head_max',\r
118     :default => 30, :validate => Proc.new{|v| v > 0 && v < 200},\r
119     :desc => "How many characters to use of a RSS item header")\r
120 \r
121   BotConfig.register BotConfigIntegerValue.new('rss.text_max',\r
122     :default => 90, :validate => Proc.new{|v| v > 0 && v < 400},\r
123     :desc => "How many characters to use of a RSS item text")\r
124 \r
125   BotConfig.register BotConfigIntegerValue.new('rss.thread_sleep',\r
126     :default => 300, :validate => Proc.new{|v| v > 30},\r
127     :desc => "How many seconds to sleep before checking RSS feeds again")\r
128 \r
129   def initialize\r
130     super\r
131     if @registry.has_key?(:feeds)\r
132       @feeds = @registry[:feeds]\r
133       @feeds.keys.grep(/[A-Z]/) { |k|\r
134         @feeds[k.downcase] = @feeds[k]\r
135         @feeds.delete(k)\r
136       }\r
137       @feeds.each { |k, f|\r
138         f.mutex = Mutex.new unless f.mutex\r
139         f.sanitize_watchers\r
140         parseRss(f) if f.xml\r
141       }\r
142     else\r
143       @feeds = Hash.new\r
144     end\r
145     @watch = Hash.new\r
146     rewatch_rss\r
147   end\r
148 \r
149   def name\r
150     "rss"\r
151   end\r
152 \r
153   def watchlist\r
154     @feeds.select { |h, f| f.watched? }\r
155   end\r
156 \r
157   def cleanup\r
158     stop_watches\r
159   end\r
160 \r
161   def save\r
162     unparsed = Hash.new()\r
163     @feeds.each { |k, f|\r
164       unparsed[k] = f.dup\r
165     }\r
166     @registry[:feeds] = unparsed\r
167   end\r
168 \r
169   def stop_watch(handle)\r
170     if @watch.has_key?(handle)\r
171       begin\r
172         debug "Stopping watch #{handle}"\r
173         @bot.timer.remove(@watch[handle])\r
174         @watch.delete(handle)\r
175       rescue => e\r
176         report_problem("Failed to stop watch for #{handle}", e, nil)\r
177       end\r
178     end\r
179   end\r
180 \r
181   def stop_watches\r
182     @watch.each_key { |k|\r
183       stop_watch(k)\r
184     }\r
185   end\r
186 \r
187   def help(plugin,topic="")\r
188     case topic\r
189     when "show"\r
190       "rss show #{Bold}handle#{Bold} [#{Bold}limit#{Bold}] : show #{Bold}limit#{Bold} (default: 5, max: 15) entries from rss #{Bold}handle#{Bold}; #{Bold}limit#{Bold} can also be in the form a..b, to display a specific range of items"\r
191     when "list"\r
192       "rss list [#{Bold}handle#{Bold}] : list all rss feeds (matching #{Bold}handle#{Bold})"\r
193     when "watched"\r
194       "rss watched [#{Bold}handle#{Bold}] [in #{Bold}chan#{Bold}]: list all watched rss feeds (matching #{Bold}handle#{Bold}) (in channel #{Bold}chan#{Bold})"\r
195     when "who", "watches", "who watches"\r
196       "rss who watches [#{Bold}handle#{Bold}]]: list all watchers for rss feeds (matching #{Bold}handle#{Bold})"\r
197     when "add"\r
198       "rss add #{Bold}handle#{Bold} #{Bold}url#{Bold} [#{Bold}type#{Bold}] : add a new rss called #{Bold}handle#{Bold} from url #{Bold}url#{Bold} (of type #{Bold}type#{Bold})"\r
199     when "change"\r
200       "rss change #{Bold}what#{Bold} of #{Bold}handle#{Bold} to #{Bold}new#{Bold} : change the #{Underline}handle#{Underline}, #{Underline}url#{Underline}, #{Underline}type#{Underline} or #{Underline}refresh#{Underline} rate of rss called #{Bold}handle#{Bold} to value #{Bold}new#{Bold}"\r
201     when /^(del(ete)?|rm)$/\r
202       "rss del(ete)|rm #{Bold}handle#{Bold} : delete rss feed #{Bold}handle#{Bold}"\r
203     when "replace"\r
204       "rss replace #{Bold}handle#{Bold} #{Bold}url#{Bold} [#{Bold}type#{Bold}] : try to replace the url of rss called #{Bold}handle#{Bold} with #{Bold}url#{Bold} (of type #{Bold}type#{Bold}); only works if nobody else is watching it"\r
205     when "forcereplace"\r
206       "rss forcereplace #{Bold}handle#{Bold} #{Bold}url#{Bold} [#{Bold}type#{Bold}] : replace the url of rss called #{Bold}handle#{Bold} with #{Bold}url#{Bold} (of type #{Bold}type#{Bold})"\r
207     when "watch"\r
208       "rss watch #{Bold}handle#{Bold} [#{Bold}url#{Bold} [#{Bold}type#{Bold}]]  [in #{Bold}chan#{Bold}]: watch rss #{Bold}handle#{Bold} for changes (in channel #{Bold}chan#{Bold}); when the other parameters are present, the feed will be created if it doesn't exist yet"\r
209     when /(un|rm)watch/\r
210       "rss unwatch|rmwatch #{Bold}handle#{Bold} [in #{Bold}chan#{Bold}]: stop watching rss #{Bold}handle#{Bold} (in channel #{Bold}chan#{Bold}) for changes"\r
211     when "rewatch"\r
212       "rss rewatch : restart threads that watch for changes in watched rss"\r
213     else\r
214       "manage RSS feeds: rss show|list|watched|add|change|del(ete)|rm|(force)replace|watch|unwatch|rmwatch|rewatch"\r
215     end\r
216   end\r
217 \r
218   def report_problem(report, e=nil, m=nil)\r
219     if m && m.respond_to?(:reply)\r
220       m.reply report\r
221     else\r
222       warning report\r
223     end\r
224     if e\r
225       debug e.inspect\r
226       debug e.backtrace.join("\n") if e.respond_to?(:backtrace)\r
227     end\r
228   end\r
229 \r
230   def show_rss(m, params)\r
231     handle = params[:handle]\r
232     lims = params[:limit].to_s.match(/(\d+)(?:..(\d+))?/)\r
233     debug lims.to_a.inspect\r
234     if lims[2]\r
235       ll = [[lims[1].to_i-1,lims[2].to_i-1].min,  0].max\r
236       ul = [[lims[1].to_i-1,lims[2].to_i-1].max, 14].min\r
237       rev = lims[1].to_i > lims[2].to_i\r
238     else\r
239       ll = 0\r
240       ul = [[lims[1].to_i-1, 0].max, 14].min\r
241       rev = false\r
242     end\r
243 \r
244     feed = @feeds.fetch(handle.downcase, nil)\r
245     unless feed\r
246       m.reply "I don't know any feeds named #{handle}"\r
247       return\r
248     end\r
249 \r
250     m.reply "lemme fetch it..."\r
251     title = items = nil\r
252     fetched = fetchRss(feed, m)\r
253     return unless fetched or feed.xml\r
254     if not fetched and feed.items\r
255       m.reply "using old data"\r
256     else\r
257       parsed = parseRss(feed, m)\r
258       m.reply "using old data" unless parsed\r
259     end\r
260     return unless feed.items\r
261     title = feed.title\r
262     items = feed.items\r
263 \r
264     # We sort the feeds in freshness order (newer ones first)\r
265     items = freshness_sort(items)\r
266     disp = items[ll..ul]\r
267     disp.reverse! if rev\r
268 \r
269     m.reply "Channel : #{title}"\r
270     disp.each do |item|\r
271       printFormattedRss(feed, item, {:places=>[m.replyto],:handle=>nil,:date=>true})\r
272     end\r
273   end\r
274 \r
275   def itemDate(item,ex=nil)\r
276     return item.pubDate if item.respond_to?(:pubDate) and item.pubDate\r
277     return item.date if item.respond_to?(:date) and item.date\r
278     return ex\r
279   end\r
280 \r
281   def freshness_sort(items)\r
282     notime = Time.at(0)\r
283     items.sort { |a, b|\r
284       itemDate(b, notime) <=> itemDate(a, notime)\r
285     }\r
286   end\r
287 \r
288   def list_rss(m, params)\r
289     wanted = params[:handle]\r
290     reply = String.new\r
291     @feeds.each { |handle, feed|\r
292       next if wanted and !handle.match(/#{wanted}/i)\r
293       reply << "#{feed.handle}: #{feed.url} (in format: #{feed.type ? feed.type : 'default'})"\r
294       (reply << " refreshing every #{Utils.secs_to_string(feed.refresh_rate)}") if feed.refresh_rate\r
295       (reply << " (watched)") if feed.watched_by?(m.replyto)\r
296       reply << "\n"\r
297     }\r
298     if reply.empty?\r
299       reply = "no feeds found"\r
300       reply << " matching #{wanted}" if wanted\r
301     end\r
302     m.reply reply\r
303   end\r
304 \r
305   def watched_rss(m, params)\r
306     wanted = params[:handle]\r
307     chan = params[:chan] || m.replyto\r
308     reply = String.new\r
309     watchlist.each { |handle, feed|\r
310       next if wanted and !handle.match(/#{wanted}/i)\r
311       next unless feed.watched_by?(chan)\r
312       reply << "#{feed.handle}: #{feed.url} (in format: #{feed.type ? feed.type : 'default'})"\r
313       (reply << " refreshing every #{Utils.secs_to_string(feed.refresh_rate)}") if feed.refresh_rate\r
314       reply << "\n"\r
315     }\r
316     if reply.empty?\r
317       reply = "no watched feeds"\r
318       reply << " matching #{wanted}" if wanted\r
319     end\r
320     m.reply reply\r
321   end\r
322 \r
323   def who_watches(m, params)\r
324     wanted = params[:handle]\r
325     reply = String.new\r
326     watchlist.each { |handle, feed|\r
327       next if wanted and !handle.match(/#{wanted}/i)\r
328       reply << "#{feed.handle}: #{feed.url} (in format: #{feed.type ? feed.type : 'default'})"\r
329       (reply << " refreshing every #{Utils.secs_to_string(feed.refresh_rate)}") if feed.refresh_rate\r
330       reply << ": watched by #{feed.watchers.join(', ')}"\r
331       reply << "\n"\r
332     }\r
333     if reply.empty?\r
334       reply = "no watched feeds"\r
335       reply << " matching #{wanted}" if wanted\r
336     end\r
337     m.reply reply\r
338   end\r
339 \r
340   def add_rss(m, params, force=false)\r
341     handle = params[:handle]\r
342     url = params[:url]\r
343     unless url.match(/https?/)\r
344       m.reply "I only deal with feeds from HTTP sources, so I can't use #{url} (maybe you forgot the handle?)"\r
345       return\r
346     end\r
347     type = params[:type]\r
348     if @feeds.fetch(handle.downcase, nil) && !force\r
349       m.reply "There is already a feed named #{handle} (URL: #{@feeds[handle.downcase].url})"\r
350       return\r
351     end\r
352     unless url\r
353       m.reply "You must specify both a handle and an url to add an RSS feed"\r
354       return\r
355     end\r
356     @feeds[handle.downcase] = RssBlob.new(url,handle,type)\r
357     reply = "Added RSS #{url} named #{handle}"\r
358     if type\r
359       reply << " (format: #{type})"\r
360     end\r
361     m.reply reply\r
362     return handle\r
363   end\r
364 \r
365   def change_rss(m, params)\r
366     handle = params[:handle].downcase\r
367     feed = @feeds.fetch(handle, nil)\r
368     unless feed\r
369       m.reply "No such feed with handle #{handle}"\r
370       return\r
371     end\r
372     case params[:what].intern\r
373     when :handle\r
374       new = params[:new].downcase\r
375       if @feeds.key?(new) and @feeds[new]\r
376         m.reply "There already is a feed with handle #{new}"\r
377         return\r
378       else\r
379         feed.mutex.synchronize do\r
380           @feeds[new] = feed\r
381           @feeds.delete(handle)\r
382           feed.handle = new\r
383         end\r
384         handle = new\r
385       end\r
386     when :url\r
387       new = params[:new]\r
388       feed.mutex.synchronize do\r
389         feed.url = new\r
390       end\r
391     when :format, :type\r
392       new = params[:new]\r
393       new = nil if new == 'default'\r
394       feed.mutex.synchronize do\r
395         feed.type = new\r
396       end\r
397     when :refresh\r
398       new = params[:new].to_i\r
399       new = nil if new == 0\r
400       feed.mutex.synchronize do\r
401         feed.refresh_rate = new\r
402       end\r
403     else\r
404       m.reply "Don't know how to change #{params[:what]} for feeds"\r
405       return\r
406     end\r
407     m.reply "Feed changed:"\r
408     list_rss(m, {:handle => handle})\r
409   end\r
410 \r
411   def del_rss(m, params, pass=false)\r
412     feed = unwatch_rss(m, params, true)\r
413     if feed.watched?\r
414       m.reply "someone else is watching #{feed.handle}, I won't remove it from my list"\r
415       return\r
416     end\r
417     @feeds.delete(feed.handle.downcase)\r
418     m.okay unless pass\r
419     return\r
420   end\r
421 \r
422   def replace_rss(m, params)\r
423     handle = params[:handle]\r
424     if @feeds.key?(handle.downcase)\r
425       del_rss(m, {:handle => handle}, true)\r
426     end\r
427     if @feeds.key?(handle.downcase)\r
428       m.reply "can't replace #{feed.handle}"\r
429     else\r
430       add_rss(m, params, true)\r
431     end\r
432   end\r
433 \r
434   def forcereplace_rss(m, params)\r
435     add_rss(m, params, true)\r
436   end\r
437 \r
438   def watch_rss(m, params)\r
439     handle = params[:handle]\r
440     chan = params[:chan] || m.replyto\r
441     url = params[:url]\r
442     type = params[:type]\r
443     if url\r
444       add_rss(m, params)\r
445     end\r
446     feed = @feeds.fetch(handle.downcase, nil)\r
447     if feed\r
448       if feed.add_watch(chan)\r
449         watchRss(feed, m)\r
450         m.okay\r
451       else\r
452         m.reply "Already watching #{feed.handle} in #{chan}"\r
453       end\r
454     else\r
455       m.reply "Couldn't watch feed #{handle} (no such feed found)"\r
456     end\r
457   end\r
458 \r
459   def unwatch_rss(m, params, pass=false)\r
460     handle = params[:handle].downcase\r
461     chan = params[:chan] || m.replyto\r
462     unless @feeds.has_key?(handle)\r
463       m.reply("dunno that feed")\r
464       return\r
465     end\r
466     feed = @feeds[handle]\r
467     if feed.rm_watch(chan)\r
468       m.reply "#{chan} has been removed from the watchlist for #{feed.handle}"\r
469     else\r
470       m.reply("#{chan} wasn't watching #{feed.handle}") unless pass\r
471     end\r
472     if !feed.watched?\r
473       stop_watch(handle)\r
474     end\r
475     return feed\r
476   end\r
477 \r
478   def rewatch_rss(m=nil, params=nil)\r
479     stop_watches\r
480 \r
481     # Read watches from list.\r
482     watchlist.each{ |handle, feed|\r
483       watchRss(feed, m)\r
484     }\r
485     m.okay if m\r
486   end\r
487 \r
488   private\r
489   def watchRss(feed, m=nil)\r
490     if @watch.has_key?(feed.handle)\r
491       report_problem("watcher thread for #{feed.handle} is already running", nil, m)\r
492       return\r
493     end\r
494     status = Hash.new\r
495     status[:failures] = 0\r
496     @watch[feed.handle] = @bot.timer.add(0, status) {\r
497       debug "watcher for #{feed} started"\r
498       failures = status[:failures]\r
499       begin\r
500         debug "fetching #{feed}"\r
501         oldxml = feed.xml ? feed.xml.dup : nil\r
502         unless fetchRss(feed)\r
503           failures += 1\r
504         else\r
505           if oldxml and oldxml == feed.xml\r
506             debug "xml for #{feed} didn't change"\r
507             failures -= 1 if failures > 0\r
508           else\r
509             if not feed.items\r
510               debug "no previous items in feed #{feed}"\r
511               parseRss(feed)\r
512               failures -= 1 if failures > 0\r
513             else\r
514               otxt = feed.items.map { |item| item.to_s }\r
515               unless parseRss(feed)\r
516                 debug "no items in feed #{feed}"\r
517                 failures += 1\r
518               else\r
519                 debug "Checking if new items are available for #{feed}"\r
520                 failures -= 1 if failures > 0\r
521                 dispItems = feed.items.reject { |item|\r
522                   otxt.include?(item.to_s)\r
523                 }\r
524                 if dispItems.length > 0\r
525                   debug "Found #{dispItems.length} new items in #{feed}"\r
526                   # When displaying watched feeds, publish them from older to newer\r
527                   dispItems.reverse.each { |item|\r
528                     printFormattedRss(feed, item)\r
529                   }\r
530                 else\r
531                   debug "No new items found in #{feed}"\r
532                 end\r
533               end\r
534             end\r
535           end\r
536         end\r
537       rescue Exception => e\r
538         error "Error watching #{feed}: #{e.inspect}"\r
539         debug e.backtrace.join("\n")\r
540         failures += 1\r
541       end\r
542 \r
543       status[:failures] = failures\r
544 \r
545       feed.mutex.synchronize do\r
546         seconds = (feed.refresh_rate || @bot.config['rss.thread_sleep']) * (failures + 1)\r
547         seconds += seconds * (rand(100)-50)/100\r
548         debug "watcher for #{feed} going to sleep #{seconds} seconds.."\r
549         @bot.timer.reschedule(@watch[feed.handle], seconds)\r
550       end\r
551     }\r
552     debug "watcher for #{feed} added"\r
553   end\r
554 \r
555   def printFormattedRss(feed, item, opts=nil)\r
556     places = feed.watchers\r
557     handle = "::#{feed.handle}:: "\r
558     date = String.new\r
559     if opts\r
560       places = opts[:places] if opts.key?(:places)\r
561       handle = opts[:handle].to_s if opts.key?(:handle)\r
562       if opts.key?(:date) && opts[:date]\r
563         if item.respond_to?(:pubDate) \r
564           if item.pubDate.class <= Time\r
565             date = item.pubDate.strftime("%Y/%m/%d %H.%M.%S")\r
566           else\r
567             date = item.pubDate.to_s\r
568           end\r
569         elsif  item.respond_to?(:date)\r
570           if item.date.class <= Time\r
571             date = item.date.strftime("%Y/%m/%d %H.%M.%S")\r
572           else\r
573             date = item.date.to_s\r
574           end\r
575         else\r
576           date = "(no date)"\r
577         end\r
578         date += " :: "\r
579       end\r
580     end\r
581     title = "#{Bold}#{item.title.chomp.riphtml}#{Bold}" if item.title\r
582     desc = item.description.gsub(/\s+/,' ').strip.riphtml if item.description\r
583     link = item.link.chomp if item.link\r
584     line1 = nil\r
585     line2 = nil\r
586     case feed.type\r
587     when 'blog'\r
588       line1 = "#{handle}#{date}#{item.category.content} blogged at #{link}"\r
589       line2 = "#{handle}#{title} - #{desc}"\r
590     when 'forum'\r
591       line1 = "#{handle}#{date}#{title}#{' @ ' if item.title && item.link}#{link}"\r
592     when 'wiki'\r
593       line1 = "#{handle}#{date}#{title}#{' @ ' if item.title && item.link}#{link} has been edited by #{item.dc_creator}. #{desc}"\r
594     when 'gmane'\r
595       line1 = "#{handle}#{date}Message #{title} sent by #{item.dc_creator}. #{desc}"\r
596     when 'trac'\r
597       line1 = "#{handle}#{date}#{title} @ #{link}"\r
598       unless item.title =~ /^Changeset \[(\d+)\]/\r
599         line2 = "#{handle}#{date}#{desc}"\r
600       end\r
601     else\r
602       line1 = "#{handle}#{date}#{title}#{' @ ' if item.title && item.link}#{link}"\r
603     end\r
604     places.each { |loc|\r
605       @bot.say loc, line1, :overlong => :truncate\r
606       next unless line2\r
607       @bot.say loc, line2, :overlong => :truncate\r
608     }\r
609   end\r
610 \r
611   def fetchRss(feed, m=nil)\r
612     begin\r
613       # Use 60 sec timeout, cause the default is too low\r
614       xml = @bot.httputil.get_cached(feed.url, 60, 60)\r
615     rescue URI::InvalidURIError, URI::BadURIError => e\r
616       report_problem("invalid rss feed #{feed.url}", e, m)\r
617       return nil\r
618     rescue => e\r
619       report_problem("error getting #{feed.url}", e, m)\r
620       return nil\r
621     end\r
622     debug "fetched #{feed}"\r
623     unless xml\r
624       report_problem("reading feed #{feed} failed", nil, m)\r
625       return nil\r
626     end\r
627     # Ok, 0.9 feeds are not supported, maybe because\r
628     # Netscape happily removed the DTD. So what we do is just to\r
629     # reassign the 0.9 RDFs to 1.0, and hope it goes right.\r
630     xml.gsub!("xmlns=\"http://my.netscape.com/rdf/simple/0.9/\"",\r
631               "xmlns=\"http://purl.org/rss/1.0/\"")\r
632     feed.mutex.synchronize do\r
633       feed.xml = xml\r
634     end\r
635     return true\r
636   end\r
637 \r
638   def parseRss(feed, m=nil)\r
639     return nil unless feed.xml\r
640     feed.mutex.synchronize do\r
641       xml = feed.xml\r
642       begin\r
643         ## do validate parse\r
644         rss = RSS::Parser.parse(xml)\r
645         debug "parsed and validated #{feed}"\r
646       rescue RSS::InvalidRSSError\r
647         ## do non validate parse for invalid RSS 1.0\r
648         begin\r
649           rss = RSS::Parser.parse(xml, false)\r
650           debug "parsed but not validated #{feed}"\r
651         rescue RSS::Error => e\r
652           report_problem("parsing rss stream failed, whoops =(", e, m)\r
653           return nil\r
654         end\r
655       rescue RSS::Error => e\r
656         report_problem("parsing rss stream failed, oioi", e, m)\r
657         return nil\r
658       rescue => e\r
659         report_problem("processing error occured, sorry =(", e, m)\r
660         return nil\r
661       end\r
662       items = []\r
663       if rss.nil?\r
664         report_problem("#{feed} does not include RSS 1.0 or 0.9x/2.0", nil, m)\r
665       else\r
666         begin\r
667           rss.output_encoding = 'UTF-8'\r
668         rescue RSS::UnknownConvertMethod => e\r
669           report_problem("bah! something went wrong =(", e, m)\r
670           return nil\r
671         end\r
672         rss.channel.title ||= "Unknown"\r
673         title = rss.channel.title\r
674         rss.items.each do |item|\r
675           item.title ||= "Unknown"\r
676           items << item\r
677         end\r
678       end\r
679 \r
680       if items.empty?\r
681         report_problem("no items found in the feed, maybe try weed?", e, m)\r
682         return nil\r
683       end\r
684       feed.title = title\r
685       feed.items = items\r
686       return true\r
687     end\r
688   end\r
689 end\r
690 \r
691 plugin = RSSFeedsPlugin.new\r
692 \r
693 plugin.map 'rss show :handle :limit',\r
694   :action => 'show_rss',\r
695   :requirements => {:limit => /^\d+(?:\.\.\d+)?$/},\r
696   :defaults => {:limit => 5}\r
697 plugin.map 'rss list :handle',\r
698   :action => 'list_rss',\r
699   :defaults => {:handle => nil}\r
700 plugin.map 'rss watched :handle [in :chan]',\r
701   :action => 'watched_rss',\r
702   :defaults => {:handle => nil}\r
703 plugin.map 'rss who watches :handle',\r
704   :action => 'who_watches',\r
705   :defaults => {:handle => nil}\r
706 plugin.map 'rss add :handle :url :type',\r
707   :action => 'add_rss',\r
708   :defaults => {:type => nil}\r
709 plugin.map 'rss change :what of :handle to :new',\r
710   :action => 'change_rss',\r
711   :requirements => { :what => /handle|url|format|type|refresh/ }\r
712 plugin.map 'rss change :what for :handle to :new',\r
713   :action => 'change_rss',\r
714   :requirements => { :what => /handle|url|format|type|refesh/ }\r
715 plugin.map 'rss del :handle',\r
716   :action => 'del_rss'\r
717 plugin.map 'rss delete :handle',\r
718   :action => 'del_rss'\r
719 plugin.map 'rss rm :handle',\r
720   :action => 'del_rss'\r
721 plugin.map 'rss replace :handle :url :type',\r
722   :action => 'replace_rss',\r
723   :defaults => {:type => nil}\r
724 plugin.map 'rss forcereplace :handle :url :type',\r
725   :action => 'forcereplace_rss',\r
726   :defaults => {:type => nil}\r
727 plugin.map 'rss watch :handle :url :type [in :chan]',\r
728   :action => 'watch_rss',\r
729   :defaults => {:url => nil, :type => nil}\r
730 plugin.map 'rss unwatch :handle [in :chan]',\r
731   :action => 'unwatch_rss'\r
732 plugin.map 'rss rmwatch :handle [in :chan]',\r
733   :action => 'unwatch_rss'\r
734 plugin.map 'rss rewatch',\r
735   :action => 'rewatch_rss'\r
736 \r