can’t open file ‘get-pip.py’: [Errno 2] No such file or directory

This save my life and works for me can’t open file ‘get-pip.py’: [Errno 2] No such file or directory on Debian 8: change directory to /usr/bin/, it requires root privileges. The key is this: get-pip.py must be downloaded on that directory.

get-pip

 

 

Advertisements

NLTK

Para practicar con un proyecto propio Java a fondo (el críptico libro del argentino Pablo Sznajdleder) estuve buscando las bases de datos de las Percepciones Acumuladas Anuales (2003). Tropecé con los archivos de NLTK. ¡Por ahí una universidad subió el libro completo de O’Reilly en pdf! (500 y pico de páginas de la primera edición 2007, que yo tuve el cuidado de imprimir en la oficina en 2010). Los tres investigadores -Steven Bird, Ewan Klein, and Edward Loper- usan Python. Hay un paquete python-nltk para Debian, aunque parece que un tanto abandonado. Las instrucciones para instalar NLTK en Debian tampoco son muy claras, pero haciendo una mixtura con la documentación oficial, sobre todo respecto a pip, el asunto camina (eso sí, desapareció de mis Aplicaciones el icono de Python 2.7.9 y se quedó el de Python 3.4.2). Tengo que leer un archivo de errores:

Command python setup.py egg_info failed with error code 1 in /tmp/pip-build-8fp3G5/numpy

installing NLTK on Debian

Storing debug log for failure in /root/.pip/pip.log

NLTK 3.1 is now available

Entiendo que la tercera edición de Natural Language Processing with Python (2016) viene con Python3 y NLTK3, pero no consigo el archivo pip install http://nltk.org/nltk3-alpha/nltk-3.0a4.tar.gz, quizá se pueda desde Github, pero no sé cómo (NLTK 3.1 is now available). Luego de la instalación, mi NLTK ha quedado en /usr/local/lib/python2.7/dist-packages/nltk, sigue la descarga del corpus, tienen varios, todos en lengua inglesa. He bajado los que corresponden a los ejemplos del libro. Aunque quizá convenga el de Twitter Samples, que ya lo han trabajado en México los colegas de la UAM-Cuajimalpa: Sistema automático para la visualización de relaciones de opiniones producidas en Twitter.

//platform.twitter.com/widgets.js

python3-nltk

python3-nltk
installing python3-nltk

Captura de pantalla de 2015-10-16 12:04:08 Captura de pantalla de 2015-10-16 12:04:31 Captura de pantalla de 2015-10-16 12:07:25

Por qué no Python?

//platform.twitter.com/widgets.js

Es la tercera o cuarta vez que intento leer El Lenguaje de Programación C++ del maestro Bjarne Stroustrup. ¡Todo está conectado! Pues Sam Bigotes, el vendedor de libros, es ahora mi vecino -donde estuvo la Librería Científica es ahora una carpintería-, a la vuelta de El Jilton. Las estructuras de datos que necesitábamos para el proyecto LexTool se llamaban tries (como el plural de tree y nada que ver con el verbo try), unos árboles especiales, tenía un artículo de un grupo de japoneses que lo presentaban, con todo y código en lenguaje C/C++. ¿Dónde quedó? Perdido en el naufragio de 2009. Lo que me llevó a recordar la pregunta de El Vikingo (+): “¿Por qué PERL?¿Por qué no Python?”. A finales de los 90s, Python todavía no era lo que llegó a ser: un lenguaje recomendado para el programador novato, en especial porque es muy poderoso y menos frustrante de aprender que Java, donde es fácil perderse. Recuerdo que hjimenez le respondió dos o tres cosas contundentes. Ahora creo que pudo haber dicho que se pretendía aprovechar C++ como superconjunto de C, y ciertos paquetes de Unix -grep, awk- para la búsqueda de regularidades léxicas interesantes. Mi maestro tenía un montón de rutinas escritas en PERL sobre el procesamiento de textos (en el sentido de la recuperación de información). Ahora sé que PERL, y también Python, se usan para aplicaciones web. Nunca hablamos de la conexión a las bases de datos, pero en HYLSA conocí un compilador de C marca HP (Hewlett-Packard) que daba esa prestación en servidores Unix. Como no teníamos Unix, pues usaríamos Linux. Lo que no recuerdo es por qué Debian, si en Fismat tenían Suse. La memoria se pierde en la noche de los tiempos. No uno, sino múltiple: polifacético, como el individuo que a un tiempo es niño-joven-adulto-viejo dependiendo de la situación que enfrenta. Además, PERL fue diseñado por Larry Wall, un lingüista, de ahí que los scripts estén dedicados al procesamiento de texto.