miércoles, 12 de marzo de 2008

Presentando DeFlog

Las tecnologías de la denominada Web 2.0 trajeron al usuario la posibilidad de formar parte de la web, mediante sitios colaborativos, como wikis, o redes sociales como blogs y fotologs.
En algunos casos, los grupos de usuarios de estos sitios, pasan de ser comunidades virtuales, a tribus urbanas.
Los floggers, como se denomina a los usuarios de fotologs, llevan a cabo reuniones frecuentes, y como toda tribu urbana, tienen sus códigos. Algunos se concentran en criticar su vestimenta o cortes de pelo. A mi mucho no me calienta, uno también fue adolescente... pero el lenguaje que usan para comunicarse en la web es algo que me cuesta tolerar. Éste puede resultar críptico para quienes hemos pasado hace algún tiempo nuestra adolescencia y de dolorosa lectura para los que sentimos el equivalente a una patada en los huevos cuando vemos una falta de ortografía en un texto.

En un intento por salvar a la juventud del flagelo del lenguaje fotolog y SMS, creé DeFlog (o Deflog, porque ya hice así el logo) . Un traductor Fotolog -> Español.

Bueno, basta de boludez. Nada más estaba al pedo y quería experimentar con algún framework para desarrollo web diferente al Zope/Plone que vengo usando en el trabajo. Un amigo me mostró algo de Django. También estuve leyendo un poco de Pylons, y en el camino me crucé con CherryPy, que era más que suficiente para lo que quería hacer. Llegué a tener algo bastante completo, pero cuando empecé a tener problemas para tratar palabras con caracteres acentuados y demás (no era la primera vez que me traían dolores de cabeza), decidí dejar Python y hacer lo que hace la mayoría. Usar PHP.
La traducción fue bastante directa y rápida, ya que el código era simple (expresiones regulares, que tienen casi la misma notación, o simples reemplazos de subcadenas por cadenas de algún arreglo)

El traductor puede corregir con bastante éxito los siguientes features del lenguaje flogger
  • Contaminación con abreviaturas típicas del SMS. (xq, tkm, bss, dsp,...)
  • Alternación de mayúsculas y minúsuclas (AlGuNa LeTrA dE uNa CaNcIoN)
  • Repetición de letras (hoooolllaaaaaa!!!!)
  • Omisión de la letra u en la subpalabra 'qu' , o bien, reemplazo de la subpalabra por 'k' (qiero, kiero)
  • Pero a veces la k reemplaza a 'ca' y otras veces, simplemente reemplaza a la letra c (kompré kafé komo loko y me agarró kgadera, ke kgada k me mandé) (este es uno de los puntos con más probabilidad de falla)
  • Faltas ortográficas intencionales como soi, voi, i en lugar de y, etc.
  • Porteñización (vistes, fuistes) (este viene de yapa porque no es particular del vocabulario flogger)

El traductor no contempla los siguientes:
  • Vocabulario aniñado (?) (te kelo muto, pobde Lodemzo, etc)
  • Zezeozizmo (tiene la opción desactivada porque no es mucho más inteligente que reemplazar todas las 'z' por 's')
  • Faltas ortográficas, salvo algunas muy comunes como llendo (¡Es yendo! ¡Hay gente que lo agrega al diccionario del celular porque piensa que no trae la palabra!)
Está desarrollado para dialecto flogger argentino. Su efectividad decaerá en fotologs de otros países.

Pueden probarlo aquí: http://www.santiagobruno.com.ar/php/desfotologuear.php

Este es un ejemplo especialmente seleccionado para ver sus características

Es muy básico, en muchos casos va a andar mal, pero esto fue un juego, lo posteo nada más porque a alguien le puede resultar chistoso o simpático. Me gustaría hacer que se traduzca una página, pero ni daaaaa!!! aahrrreeee!!

Ah, y en conclusión, no aprendí nada de ninguno de los frameworks mencionados, porque fue un programa muy pelotudo, pero ¿qué querés? Me divierte hacer estas huevadas...

Chau, blds!!!!

Update 07/04/2008:
¿No será mucho?

Update 31/05/2008:
Claro que no es mucho. Aún hay más. Solucioné los problemas que tenía inicialmente con Python, y agregué esa versión. (ver en google code)

Update 28/07/2008:
Ahora estuve haciendo un parser re pedorro para traducir una página web. Anda bastante bien para los fotologs, pero el problema es obtener la página externa.
La versión en javascript solo me anduvo en Konqueror, porque por cuestiones de seguridad los requests con javascript están limitados al mismo dominio de la página. Aparentemente a Konqueror no le importa, pero en los otros navegadores no me anda.
Para la versión en php es necesario tener el servidor configurado con algunas excepciones, y no es el caso del proveedor donde tengo la página, así que tengo como resultado
file_get_contents(): URL file-access is disabled in the server configuration
Solo subí la versión en Python ya que esa solo se ejecuta localmente.

4 comentarios:

Alejandro dijo...

Hey vieha, una masa boloooo!!!
Que buen blog. Desde que lo leo me volvió a crecer el pelo y volví a hablar de corrido!!

Gracias vieja, después de Palau sos la respuestas a todas mis pregutas!!

ra dijo...

jajaja
qué bueno boló!
tipo nada, viste, ahora, tipo, lo re unico mega que hace posta re falta es que no sé, ponele, nada, que sea capaz, tipo, de sacar toda la webaAaAAAda de un tipo texto, qué sé yo, para dejar onda solamente el mensaje.

Oh dios. Los odio.

Anónimo dijo...

uuhhhhhh looooooooogo mato
cryptic writings..
joa

Anónimo dijo...

arre es buenisimooooo jkaskjasjkajsajka, hay agregame a effes que agrego por reverse arre sos re tap

TRADUCCION:
Esta buenisimo, jajajaja (risas)

=)

www.codigounix.com.ar

yo tmb. spameo =)