Encuentra a tus autores aquí

lunes, abril 09, 2007

José Antonio Millán: Cifras sobre el idioma



Pese a ser el español la cuarta lengua más hablada del mundo, internet es su gran desafío. Su impacto en la red es mínimo: 4,6% de las webs, 150 libros en el Proyecto Gutenberg frente a los 18.000 en inglés o 200.000 entradas de Wikipedia de un total de seis millones.

La red está llena de palabras. A pesar de la expansión de los sitios de juego, de fotos, vídeos y archivos de sonido, internet es un inmenso océano de términos. Una y otra vez los estudios demuestran que en las páginas web las personas buscan el texto, y luego miran las imágenes. Para buscar vídeos usamos palabras, y es más: al lado de cada sitio de juego, de exhibición de clips o fotos, están los foros y los chats en los que los aficionados cambian información, se cuentan proezas o sencillamente están en contacto. La red es hoy una gigantesca conversación.

En la red hay dos tipos de palabras: las vivas y las inertes. Paradójicamente, las vivas son las que pueden leer tanto las máquinas como los hombres; las inertes sólo pueden ser leídas por personas. Los robots surcan la red leyendo las páginas y almacenando sus contenidos, de modo que los sitios que tienen sólo imágenes de palabras, dibujos de letras (en forma de ilustración o como animaciones) no podrán ser leídos, y quedarán fuera del diálogo. Los buscadores saben qué vocablos hay en los sitios que se dejan leer y, a través de los enlaces, saben también qué opinan sus creadores sobre los sitios a los que enlazan. Y por las nubes de comentarios que rodean a muchos textos saben también más sobre ellos.

Esta conversación de la red es multilingüe por naturaleza. ¿Interesa saber cuánto de ella se hace en español? Interesa más saber qué se hace en este idioma, pero podemos empezar por su extensión: de las lenguas escritas en alfabeto latino (es decir, sin el chino, el ruso...) el español está en cuarto lugar. El primero es el inglés, que, contra lo que muchos creen, no domina omnímodamente en el ciberespacio: tiene el 45% de las páginas que hay en estas lenguas, y su proporción baja desde hace una década. Luego viene el alemán (casi un 7%), el francés (4,95%) y el español (4,6%). Todo ello según la última estimación de Funredes(http://funredes.org/, 2005).¿Qué hacen los hispanohablantes en la red? Por un lado, lo que todo el mundo: buscar cosas. Los buscadores informan periódicamente sobre sus términos más buscados: Google da para España el pasado mes los términos "marca, as" y para México "san valentín, britney spears". Yahoo para el pasado año atribuye a España "chat, juegos".Por otro lado, crean cosas (y ése es el factor que mejor define la red actual, que algunos llaman Web 2.0).

Los hispanohablantes crean blogs, páginas web, comentarios en foros, suben fotografías y vídeos... Los blogs son los más famosos mediáticamente, aunque su heterogeneidad es tal –los hay periodísticos, narrativos, profesionales, eróticos, musicales, de autopromoción, e incluso indefinibles- que no se debe generalizar. Y en lo que toca a su número (¿cien millones en todo el mundo, para este año?) y a los que se hacen en España (¿medio millón?, ¿un millón?), mejor no hablar ...Los hispanohablantes contribuyen poco a proyectos de voluntarios. El Proyecto Gutenberg de libros sin derechos (con más de treinta años en la red) presenta menos de 150 títulos en español, frente a 18.000 en inglés y 1.000 en francés. La Wikipedia en español tiene más de 200.000 entradas, frente a las más de 460.000 de la francesa, y los 6 millones de las 186lenguas en que se hace.

Quienes crean en la red también enlazan, comunican. No he encontrado estudios sobre el tema, pero por las páginas y blogs da la impresión de que, aunque unidos por una lengua común, los sitios web latinoamericanos y los de España constituyen "bolsas" endogámicas: más que enlazar hacia fuera, citan a los de su mismo espacio geográfico.Para lo que sí hay estudios fiables es para las universidades: el Laboratorio de Cibermetría delConsejo Superior de Investigaciones Científicas lleva años estudiando sus webs (http://www.webometrics.info/). Se evalúa la cantidad de páginas que publican, su visibilidad (o enlaces recibidos desde el exterior), la proporción de ficheros ricos (PDF, Word... que suelen tener un contenido más científico) y por último el número de artículos y citas, según Google Académico. En el último estudio, de enero, el resultado es que la primera universidad de un país hispanohablante es la Universidad Nacional Autónoma de México (puesto 84 de todas las del mundo), seguida por la Complutense de Madrid (162) y la de Chile (265).Las mejor situadas globalmente son las de Estados Unidos y Canadá (suman 123 centros entre los 200 primeros y 238 entre los 500), mientras que Hispanoamérica más España suman 2 universidades entre las 200 primeras y 24 -20 de ellas españolas- entre las 500. Pero muchos de los contenidos de las webs universitarias de países hispanohablantes estarán eninglés, la lengua de comunicación científica. A cambio, pero en menor cuantía, contenidos de los centros norteamericanos o brasileños estarán en español.

Para medir estos factores se utilizan sobre todo los buscadores (Yahoo, Google...) y los sitios especializados en documentación científica (Google Académico). ¿Es posible que estos instrumentos presenten un sesgo que aumente artificialmente centros situados en Estados Unidos (o en general en países anglohablantes)? Podría ser, aunque leve, pero más bien tiendo a creer que nuestros sitios web académicos -al igual que muchos otros de nuestras empresas e instituciones- no ayudan a los buscadores, al repartir contenidos entre variosdominios y usar interfaces opacas que no dejan acceder a sus contenidos profundos.

En ciencia otro factor positivo de visibilidad es la existencia de repositorios para publicar de forma abierta, accesibles sin pago ni suscripción. Está demostrado que las obras divulgadasde esta forma aumentan su popularidad -las citas que les hacen-, con lo que crece la visibilidad de sus autores y de los centros a los que pertenecen. Por fortuna, ya empiezan a existir iniciativas a muy distintos niveles para fomentar este tipo de publicación, como E-ciencia, de la red Madrid.En general las instituciones culturales de España, tanto públicas como privadas, no fomentan ni la conversación sobre sus contenidos ni el conocimiento de otros ajenos. Dos estudios de la revista Dosdoce, uno sobre instituciones relacionadas con el arte (2006) y otro sobre editoriales (2005), destacan la escasez de medios de dar voz a su público (foros, blogs, etcétera) y la pobreza de enlaces a sitios similares.La prensa digital hispanohablante, sin embargo, lleva años con un desarrollo destacado (e incorpora crecientemente blogs y comentarios). Por otro lado, están creciendo mucho las obras en el dominio público en texto buscable (la Biblioteca Virtual Miguel de Cervantes, Google Libros o la Hemeroteca Digital de la Biblioteca Nacional) y la cantidad de obras enfacsímil (la Biblioteca Virtual de Prensa Histórica del Ministerio de Cultura). No hay datos comparativos, pero apostaría a que en internet la riqueza de obras en español -y, por cierto, en las lenguas cooficiales-supera a la que se encuentra en otras lenguas. Sólo es una pena que las instituciones públicas que difunden nuestro patrimonio en el dominio público no adoptenuna política valiente y explícita de licencias que favorezca que las obras se multipliquen por la web y germinen en millares de investigaciones y publicaciones.
José Antonio Millán (Madrid, 1954) publica el blog El futuro del libro y es autor de las obras Flor y farola y Nueva Lisboa.

No hay comentarios.: