miércoles, 12 de marzo de 2008

Presentando DeFlog

Las tecnologías de la denominada Web 2.0 trajeron al usuario la posibilidad de formar parte de la web, mediante sitios colaborativos, como wikis, o redes sociales como blogs y fotologs.
En algunos casos, los grupos de usuarios de estos sitios, pasan de ser comunidades virtuales, a tribus urbanas.
Los floggers, como se denomina a los usuarios de fotologs, llevan a cabo reuniones frecuentes, y como toda tribu urbana, tienen sus códigos. Algunos se concentran en criticar su vestimenta o cortes de pelo. A mi mucho no me calienta, uno también fue adolescente... pero el lenguaje que usan para comunicarse en la web es algo que me cuesta tolerar. Éste puede resultar críptico para quienes hemos pasado hace algún tiempo nuestra adolescencia y de dolorosa lectura para los que sentimos el equivalente a una patada en los huevos cuando vemos una falta de ortografía en un texto.

En un intento por salvar a la juventud del flagelo del lenguaje fotolog y SMS, creé DeFlog (o Deflog, porque ya hice así el logo) . Un traductor Fotolog -> Español.

Bueno, basta de boludez. Nada más estaba al pedo y quería experimentar con algún framework para desarrollo web diferente al Zope/Plone que vengo usando en el trabajo. Un amigo me mostró algo de Django. También estuve leyendo un poco de Pylons, y en el camino me crucé con CherryPy, que era más que suficiente para lo que quería hacer. Llegué a tener algo bastante completo, pero cuando empecé a tener problemas para tratar palabras con caracteres acentuados y demás (no era la primera vez que me traían dolores de cabeza), decidí dejar Python y hacer lo que hace la mayoría. Usar PHP.
La traducción fue bastante directa y rápida, ya que el código era simple (expresiones regulares, que tienen casi la misma notación, o simples reemplazos de subcadenas por cadenas de algún arreglo)

El traductor puede corregir con bastante éxito los siguientes features del lenguaje flogger
  • Contaminación con abreviaturas típicas del SMS. (xq, tkm, bss, dsp,...)
  • Alternación de mayúsculas y minúsuclas (AlGuNa LeTrA dE uNa CaNcIoN)
  • Repetición de letras (hoooolllaaaaaa!!!!)
  • Omisión de la letra u en la subpalabra 'qu' , o bien, reemplazo de la subpalabra por 'k' (qiero, kiero)
  • Pero a veces la k reemplaza a 'ca' y otras veces, simplemente reemplaza a la letra c (kompré kafé komo loko y me agarró kgadera, ke kgada k me mandé) (este es uno de los puntos con más probabilidad de falla)
  • Faltas ortográficas intencionales como soi, voi, i en lugar de y, etc.
  • Porteñización (vistes, fuistes) (este viene de yapa porque no es particular del vocabulario flogger)

El traductor no contempla los siguientes:
  • Vocabulario aniñado (?) (te kelo muto, pobde Lodemzo, etc)
  • Zezeozizmo (tiene la opción desactivada porque no es mucho más inteligente que reemplazar todas las 'z' por 's')
  • Faltas ortográficas, salvo algunas muy comunes como llendo (¡Es yendo! ¡Hay gente que lo agrega al diccionario del celular porque piensa que no trae la palabra!)
Está desarrollado para dialecto flogger argentino. Su efectividad decaerá en fotologs de otros países.

Pueden probarlo aquí: http://www.santiagobruno.com.ar/php/desfotologuear.php

Este es un ejemplo especialmente seleccionado para ver sus características

Es muy básico, en muchos casos va a andar mal, pero esto fue un juego, lo posteo nada más porque a alguien le puede resultar chistoso o simpático. Me gustaría hacer que se traduzca una página, pero ni daaaaa!!! aahrrreeee!!

Ah, y en conclusión, no aprendí nada de ninguno de los frameworks mencionados, porque fue un programa muy pelotudo, pero ¿qué querés? Me divierte hacer estas huevadas...

Chau, blds!!!!

Update 07/04/2008:
¿No será mucho?

Update 31/05/2008:
Claro que no es mucho. Aún hay más. Solucioné los problemas que tenía inicialmente con Python, y agregué esa versión. (ver en google code)

Update 28/07/2008:
Ahora estuve haciendo un parser re pedorro para traducir una página web. Anda bastante bien para los fotologs, pero el problema es obtener la página externa.
La versión en javascript solo me anduvo en Konqueror, porque por cuestiones de seguridad los requests con javascript están limitados al mismo dominio de la página. Aparentemente a Konqueror no le importa, pero en los otros navegadores no me anda.
Para la versión en php es necesario tener el servidor configurado con algunas excepciones, y no es el caso del proveedor donde tengo la página, así que tengo como resultado
file_get_contents(): URL file-access is disabled in the server configuration
Solo subí la versión en Python ya que esa solo se ejecuta localmente.

sábado, 8 de marzo de 2008

MobiGM "ported" to Python

Reciently, a friend told me about MobiGM, a simple Perl script that parses a rss feed from a gmail account, and sends notifications about new mails to an email account. Ideally, to the one corresponding to your cell phone.

He was having troubles trying to run the script. The problem was simple: The link to the code was dead, and copying and pasting the fragments of code didn't work, because some html special characters were bothering. A few replacements made the script go.

It worked fine sending mails through my ISP SMTP server, since it doesn't require authentication, but I couldn't send mails from my gmail account.
I tried modifying the script, using the module Net::SMTP::SSL, but I had no luck, so I decided to write it in Python.

It works. It has the same functionality as MobiGM and can authenticate against a SMTP server with TLS. But it uses minidom to parse the rss feed, and access to its data in a very direct way, assuming that the feed has always the correct format.
I recommend reading the original post of MobiGM from its author's blog, because it is a nice tutorial on how to build a small application to solve a problem, using various open source tools.
The program itself is not very useful, since you can do the same thing with gmail's filters. But the author remarks the posibility of customizing it, to make it react dinamically to what appears in your mailbox.


Having said that, here is the code:

#!/usr/bin/python

from xml.dom.minidom import parse

SMTP_SERVER = "smtp.yourisp.com:port" #port not needed on servers
#that listen to on port 25
#for gmail use 587,

REQUIRES_AUTHENTICATION = True
REQUIRES_TLS = True
SMTP_USERNAME = 'username'
SMTP_PASSWORD = 'password'
FROM_EMAIL = 'email@isp.com'
TO_EMAIL = 'cellphone@phonecompany.com'

def sendMail(message):
import smtplib
s = smtplib.SMTP(SMTP_SERVER)
#s.debuglevel = 5
s.ehlo()

if REQUIRES_TLS:
s.starttls()
s.ehlo()
if REQUIRES_AUTHENTICATION:
s.esmtp_features["auth"] = "LOGIN PLAIN"
s.login(SMTP_USERNAME, SMTP_PASSWORD)

s.sendmail(FROM_EMAIL, TO_EMAIL, message)
s.quit()


oldIDs = []
newIDs = []

try:
OLDID = open('ids.old', 'rw')
except:
OLDID = None
newfile = open('ids.old', 'w')
newfile.close()

if OLDID:
for line in OLDID.readlines():
oldIDs.append(line.strip())

try:
xmldoc = parse('atomfeed')
except IOError:
quit("Error opening file 'atomfeed'")
except:
quit("Problem parsing file 'atomfeed'")

entries = xmldoc.getElementsByTagName('entry')

for entry in entries:
curID = entry.getElementsByTagName('id')[0].firstChild.nodeValue
newIDs.append(curID)
if not curID in oldIDs:
curTitle = entry.getElementsByTagName('title')[0].firstChild.nodeValue
curContents = entry.getElementsByTagName('summary')[0].firstChild.nodeValue
curAuthorEmail = entry.getElementsByTagName('email')[0].firstChild.nodeValue
curAuthor = entry.getElementsByTagName('name')[0].firstChild.nodeValue
sendMail('Subject:'+ curTitle + '\n\nFrom:' + curAuthorEmail + ' [' + curAuthor + ']\n' + curContents)


OLDID = open('ids.old', 'w')

for newid in newIDs:
OLDID.write(newid + '\n')

OLDID.close()


As Perl's version, this script needs to be added to a shell script, where wget will be executed before it to receive the feed. And that script should be executed periodically by cron.
If we saved this script as mail.py, the shell script would be something like this:

#!/bin/sh
wget -O atomfeed https://mail.google.com/gmail/feed/atom --http-user=gmail.user@gmail.com --http-password=gmailPassword
./mail.py



Read the original post on MobiGM author blog for more details.