]> git.netwichtig.de Git - user/henk/code/ruby/rbot.git/blobdiff - data/rbot/plugins/urban.rb
plugins: remove excess requires and Net::HTTP.version setups
[user/henk/code/ruby/rbot.git] / data / rbot / plugins / urban.rb
index f95eabd6f35e23ec88f26cbe5ba31fd1ad038aa3..1a4b9d74e34562d823a7e487cbc8238a2f600fd1 100644 (file)
-require 'cgi'
-begin
-  require 'rubyful_soup'
-rescue
-  warning "could not load rubyful_soup, urban dictionary disabled"
-  warning "please get it from http://www.crummy.com/software/RubyfulSoup/"
-  warning "or install it via gem"
-  return
-end
-require 'uri/common'
-
 class UrbanPlugin < Plugin
 
   def help( plugin, topic="")
-    "~urban [word] [n]. Give the [n]th definition of [word] from urbandictionary.com."
+    "urban [word] [n]: give the [n]th definition of [word] from urbandictionary.com. urbanday: give the word-of-the-day at urban"
   end
 
-  def privmsg( m )
+  def urban(m, params)
+    words = params[:words].to_s
+    n = params[:n].nil? ? 1 : params[:n].to_i rescue 1
 
-    unless(m.params && m.params.length > 0)
-      m.reply "incorrect usage: " + help(m.plugin)
+    if words.empty?
+      resp = @bot.httputil.head('http://www.urbandictionary.com/random.php',
+                               :max_redir => -1)
+      if resp.code == "302" && (loc = resp['location'])
+        words = URI.unescape(loc.match(/define.php\?term=(.*)$/)[1]) rescue nil
+      end
+    end
+    # we give a very high 'skip' because this will allow us to get the number of definitions by retrieving the previous definition
+    uri = "http://www.urbanwap.com/search.php?term=#{URI.escape words}&skip=65536"
+    page = @bot.httputil.get(uri)
+    if page.nil?
+      m.reply "Couldn't retrieve an urban dictionary definition of #{words}"
       return
     end
-
-    paramArray = m.params.split(' ')
-    definitionN = 0
-    if m.params == 'random' then
-      uri = URI.parse( "http://www.urbandictionary.com/random.php" )
-    else 
-      if( paramArray.last.to_i != 0 ) then
-        definitionN = paramArray.last.to_i - 1
-        query = m.params.chomp( paramArray.last )
-        query.rstrip!
-      else
-        query = m.params
-      end
-      uri = URI.parse( "http://www.urbandictionary.com/define.php?term=#{ URI.escape query}" )
+    if page =~ / is undefined<\/card><\/wml>/
+      m.reply "There is no urban dictionary definition of #{words}"
+      return
     end
-
-    soup = BeautifulSoup.new( @bot.httputil.get_cached( uri ) )
-    if titleNavi = soup.find_all( 'td', :attrs => { 'class' => 'def_word' } )[0] then
-      title = titleNavi.contents
-      results = soup.find_all( 'div', :attrs => { 'class' => 'def_p' } )
-      # debug PP.pp(results,'')
-      output = Array.new
-      if results[definitionN] then
-        results[definitionN].p.contents.each { |s| output.push( strip_tags( s.to_s ) ) }
-        m.reply "\002#{title}\002 - #{output}"
-      else
-        m.reply "#{query} does not have #{definitionN + 1} definitions."
-      end
+    if page =~ /&amp;skip=(\d+)">prev<\/a>/
+      numdefs = $1.to_i + 1
     else
-      m.reply "#{m.params} not found."
+      numdefs = 1
+    end
+    n = numdefs + n + 1 if n < 0
+    if n > numdefs
+      m.reply "Urban dictionary only has #{numdefs} definitions for '#{words}'"
+      n = numdefs
     end
+    if n < numdefs
+      uri = "http://www.urbanwap.com/search.php?term=#{URI.escape words}&skip=#{n-1}"
+      page = @bot.httputil.get(uri)
+      if page.nil?
+        case n % 10
+        when 1
+          ord = 'st'
+        when 2
+          ord = 'nd'
+        when 3
+          ord = 'rd'
+        else
+          ord = 'th'
+        end
+        m.reply "Couldn't retrieve the #{n}#{ord} urban dictionary definition of #{words}"
+        return
+      end
+    end
+    m.reply "#{get_def(page)} (#{n}/#{numdefs})"
+  end
 
+  def get_def(text)
+    # Start by removing the prev/home/next links
+    t = text.gsub(/(?:<a href[^>]*>prev<\/a> )?<a href[^>]*>home<\/a>(?: <a href[^>]*>next<\/a>)?/,'')
+    # Close up paragraphs
+    t.gsub!(/<\/?p>/, ' ')
+    t.gsub!("\n", ' ')
+    # Reverse headings
+    t.gsub!(/<\/?b>/,"#{Reverse}")
+    # Enbolden links
+    t.gsub!(/<\/?a(?: [^>]*)?>/,"#{Bold}")
+    # Reverse examples
+    t.gsub!(/<\/?(?:i|em)>/,"#{Underline}")
+    # Clear anything else
+    t.gsub!(/<.*?>/, '')
+
+    Utils.decode_html_entities t.strip
   end
 
-  def strip_tags(html)
-    html.gsub(/<.+?>/,'').
-    gsub(/&amp;/,'&').
-    gsub(/&quot;/,'"').
-    gsub(/&lt;/,'<').
-    gsub(/&gt;/,'>').
-    gsub(/&ellip;/,'...').
-    gsub(/&apos;/, "'").
-    gsub("\n",'')
+  def uotd(m, params)
+    home = @bot.httputil.get("http://www.urbanwap.com/")
+    if home.nil?
+      m.reply "Couldn't get the urban dictionary word of the day"
+      return
+    end
+    home.match(/Word of the Day: <a href="(.*?)">.*?<\/a>/)
+    wotd = $1
+    debug "Urban word of the day: #{wotd}"
+    page = @bot.httputil.get(wotd)
+    if page.nil?
+      m.reply "Couldn't get the urban dictionary word of the day"
+    else
+      m.reply get_def(page)
+    end
   end
 end
 
 plugin = UrbanPlugin.new
-plugin.register( "urban" )
+plugin.map "urban *words :n", :requirements => { :n => /^-?\d+$/ }, :action => 'urban'
+plugin.map "urban [*words]", :action => 'urban'
+plugin.map "urbanday", :action => 'uotd'
+