La información en soporte de papel constituyó en su tiempo la mejor forma de compartir, almacenar y manejar información. En las últimas décadas, junto con el desarrollo de la informática, ha aparecido una nueva tecnología que, paulatinamente, está sustituyendo al papel en ese cometido: las comunicaciones digitales. Estas, que dependen directamente de la informática han sido, junto con el SIDA, los campos de la ciencia que más rápidamente han evolucionado en la última década. Los profesionales disponen ahora en su propia casa de una ingente cantidad de información actualizada diariamente.
Bajo esta tecnología emergente subyace una importante problemática, donde la calidad y la posible manipulación de esta información es sólo una parte del iceberg. Por ello, para poder hacer uso racional de esta tecnología, es necesario manejar un conjunto de herramientas y habilidades que nos permitan separar la información de calidad de la basura digital.
Actualmente existe tal cantidad de información en la Red, sobre las ITS y el SIDA, que es imposible acceder siquiera a una ínfima parte de ella. Esta información es muy valiosa, pero más importante es que sea válida, de buena fuente, bien documentada y pertinente.
Aprender a buscar, manejar y navegar por la información, saber seleccionar la información relevante y de calidad es el objetivo de este tema.
Internet es una red de ordenadores enlazados entre sí. Como característica propia cabe destacar que no está gobernada ni controlada por nadie. Esta red está formada por millones de ordenadores (HOST) interconectados entre sí. A su vez, a estos ordenadores, se añaden los millones de usuarios que navegan entre ellos buscando o compartiendo información. Los enlaces (conexiones) entre ordenadores pueden ser de: fibra óptica, cables de cobre o telefónicos. La peculiaridad de poder utilizar las líneas telefónicas la convierten en la única red accesible desde cualquier parte del mundo donde haya un teléfono.
Los ordenadores se comunican entre sí por medio de un conjunto de normas denominadas protocolos de comunicación. En Internet hay dos protocolos básicos: Trasmision Control Protocol (TCP) e Internet Protocol (IP). Mediante este último protocolo, a cada ordenador que se conecta a la red se le asigna un número identificativo IP (parecido a una dirección postal).
Internet lo forman millones de ordenadores conectados entre sí con un “lenguaje” común
El número IP está formado por cuatro números del 0 al 256, por lo tanto las posibles direcciones van desde la 000.000.000.000 a la 256.256.256.256. Debido a que es más difícil recordar el número de un ordenador determinado en la red, se creó el Domain Name System (DNS). Su utilidad es grande ya que transforma el número en una dirección textual mucho más fácil de recordar. Por ejemplo la red canaria tiene como dirección DNS y número IP: www.gobiernodecanarias.org [195.53.174.195]
En sus orígenes Internet fue sobre todo utilizado para el envío y recepción de correo electrónico. Posteriormente, se fueron añadiendo nuevos protocolos y servicios. Hoy en día existen multitud de aplicaciones como las páginas Web, buscadores de información, publicaciones electrónicas, congresos virtuales, grupos de trabajo virtuales, listas de correo etc. Estas aplicaciones son posibles gracias a un conjunto de protocolos de comunicaciones específicos:
Fue uno de los primeros protocolos de comunicaciones disponibles en la red. Hace posible bajarnos cualquier archivo de la Red a nuestro ordenador. Este protocolo ya suele estar integrado en los navegadores de Internet.
Este protocolo de comunicación gestiona el correo electrónico. Es una nueva vía de transmisión de información de forma instantánea que está desplazando al correo tradicional, siendo una de las herramientas más utilizadas en Internet. De la misma forma que en el correo postal, cada usuario tiene una dirección electrónica que le identifica en la Red. Los e-mails se almacenan en nuestro servidor de Internet, y se descarga a nuestro ordenador cuando nos conectamos a él.
Actualmente se considera la principal fuente de transmisión y propagación de virus. Para paliar en lo posible este problema es recomendable disponer de un antivirus, instalado en el ordenador, actualizado al menos una vez por semana y cumplir con las normas de estilo del correo electrónico.
El uso adecuado de estas normas evitan al máximo la propagación de virus y de correo no deseado (span). Para ello se deben cumplimentar los distintos apartados que conforman el correo, como son:
Para ampliar esta información puede consultar ULR www.rediris.es/mail/estilo.es.html
Esta aplicación permite la conexión remota a cualquier ordenador de la red que preste (o ceda) sus servicios. De esta forma, lo que escribimos con el teclado de nuestro ordenador en realidad se está ejecutando en el ordenador remoto.
El protocolo de comunicaciones http (HyperText Transport Protocol), desarrollado por el CERN (Laboratorio Europeo de Física de Partículas) para uso interno de sus investigadores, ha llegado a ser el más famoso protocolo de comunicación, ya que gestiona la transmisión de páginas WEB.
Protocolo de comunicación es un conjunto de normas específicas para cada tipo de información
Estas incluyen, junto al texto, elementos multimedia como la imagen, sonido, vídeo, enlaces a otras páginas Web (hipertexto). Para acceder y moverse por la páginas Web (navegar) se necesitan unos programas llamados navegadores.
Este protocolo gestiona un formato de e-mail, para recibir información actualizada de un tema determinado. Una lista de correo es un conjunto de direcciones de correo electrónico que se usan para enviar mensajes a todos los usuarios que se apunten (suscribirse) a la lista. Una vez suscrito se reciben los mensajes que cada miembro de la lista envíe. Hay miles de listas sobre los más variados temas.
Los News, grupos de discusión o newsgroup, son similares a un gran tablón de anuncios digital, en el que cualquier usuario puede leer y poner mensajes para que sean leídos por el resto de las personas. Están organizados en múltiples temas, de hecho, hay más de 10.000 áreas temáticas en la red. Al contrario de las listas de correo, para leer los News hay que bajarlos de la red.
Este sistema más conocido como Chat, desarrollado en 1998 en Finlandia, permite a los usuarios conectados a este servicio establecer diálogos (multiconferencias), en tiempo real, entre los participantes mediante el teclado.
Toda persona que navega por la Red genera una gran cantidad de información que es invisible para la mayoría de usuarios. Cuando se envía un correo electrónico o se rellena un formulario, se envían datos personales que pueden ser interceptados por otras personas.
Si deseas ampliar la información sobre virus visita:
Antivirus
virusattack.virusattack.com.ar/intro/index.php
Además las empresas que ofrecen servicios de Internet disponen de los datos personales de los usuarios que se los facilitamos cuando contratamos la conexión y cuando navegamos, ya que el registro de todos nuestros movimientos ( envio de correo-e, uso de Chat, o la navegación por las páginas) queda registrado en un archivo de registro. Este archivo recoge los siguientes datos:
Tu número de teléfono, teléfono al que te conectas, (comprobación del usuario y contraseña no se almacena), Identificador IP de tu ordenador (por lo tanto el nombre de usuario), tiempo de conexión y bytes enviados y recibidos.
La mayoría de usuarios no se conecta directamente a Internet, lo hacen por medio de ordenadores interpuestos que reciben el nombre de servidores proxy. Estos ordenadores prestan unos servicios especiales ya que almacenan las páginas a las que los usuarios acceden. Si un segundo usuario se conecta a la misma página, a la que ha accedido otro anteriormente, esta no será descargada del servidor original sino del servidor proxy. En estos servidores se almacena gran cantidad de información “personal” como puede ser el tipo de páginas que se visita, las imágenes o los ficheros que se descargan e incluso el artículo que se compró a través de Internet. En el caso del correo electrónico ocurre algo similar. Almacenan los correos electrónicos de la persona que envía y del que recibe el correo, si se ha recibido correctamente (significa que la dirección existe) … etc.
La información en soporte digital posee un conjunto de ventajas que no se obtienen con ningún otro medio. La inmediatez, la actualización diaria, la flexibilidad que, junto a la facilidad transmisión y distribución, han hecho posible el crecimiento espectacular de esta forma de representar la información.
Pero no todo son ventajas, el soporte digital lleva implícita una serie de inconvenientes que siempre debemos tener presentes: la información es inmediata pero, por el propio diseño de la red, nadie está encargado de controlar la información que se vierte en ella, por lo que cualquier amateur puede poner información en la misma. La mayor parte del contenido existente está poco contrastado o validado. Otro inconveniente es la facilidad de manipulación de su contenido con o sin consentimiento del autor. Y por último el soporte digital ha puesto en nuestras manos un gran volumen de información como nunca hubiésemos imaginado, pero su propio volumen la hace difícilmente manejable.
Internet se ha convertido en una fuente importante de información sobre salud y sexualidad para los jóvenes, ya que les ofrece un medio anónimo donde resolver preguntas que pudiera resultar embarazoso planteárselas a los adultos[1].
La seguridad y fiabilidad, de la información en internet, son aspectos que hay que valorar siempre
Cuando buscamos información en Internet nos encontramos ante una serie de problemas: Existe mucha información e información poco relevante (ruido), desorganizada, de calidad variable, difícil de encontrar y que consume mucho tiempo para encontrarla. Estos problemas se resuelven en gran medida estableciendo criterios de calidad y/o bibliográficos de búsqueda, que permitan seleccionar con rapidez la información de calidad. Aprender a determinar rápidamente la importancia de la información de una fuente es la base de cualquier proceso de búsqueda. La información que adquirimos de Internet puede ser cientos de veces más rápida de obtener, que una búsqueda realizada en una biblioteca; pero puede ocurrir que la información obtenida no tenga calidad para nuestro propósito.
El análisis de cualquier documento (hasta los bajados de Internet), puede abordarse incluso sin tener que leerlo. Esta forma de análisis está basada en criterios bibliográficos, válidos también para las búsquedas en cualquier base de datos, como son: revista, título, autor o autores y resumen. Estos componentes ayudan a determinar la utilidad de la cita. Del mismo modo debemos tener en cuenta estos datos para valorar la información que obtenemos de Internet:
Todas las páginas que ofrecen información de calidad están convenientemente referenciadas por su autor. De él hay que analizar cada uno de los siguientes aspectos:
Este dato es de gran importancia en los campos científicos donde la evolución se mide en semanas o días, y no en años. Las áreas como las ITS y el SIDA, o la Informática podrían considerarse dos campos de una evolución muy rápida. Aunque estemos en una página Web de prestigio, es imprescindible mirar la fecha de la última actualización para evitar recoger información obsoleta.
Es la persona o entidad que sufraga el gasto que supone mantener la información en la Red. Puede ser una institución científica, educativa o una empresa comercial, por lo tanto sus fuentes de financiación serán privadas. Es necesario que deje claro cuál es su propósito en mantener la página en la Red, pues la información podría estar distorsionada o sesgada para favorecer sus intereses particulares; si bien el aval de una institución respetable, por si sola, no garantiza la calidad de la información.
Hecha la primera aproximación hay que examinar el cuerpo del documento, comenzando por el prólogo, que informará de las intenciones del autor de la página Web. Posteriormente el índice nos dará una información global de la materia que abarca, comprobando que se hayan incluido citas bibliográficas.
Deberá estar claro si la información es material primario, es decir, producido por los autores de la investigación o es secundario, basado en otras fuentes. En este caso las citas bibliográficas serán fundamentales.
Debe estar claramente indicado a que tipo de audiencia se dirige la información (publicación especializada o enfocada al público general), para saber si es una fuente elemental o demasiado técnica.
No siempre es fácil separar los hechos comprobados, de las opiniones del autor, o de la simple propaganda. Normalmente los hechos pueden verificarse; las opiniones, aunque pueden estar basados en informaciones ciertas, pueden ser una interpretación personal de los hechos, por lo que siempre hay que buscar errores u omisiones en la información. Los escritores experimentados pueden hacer pensar que sus interpretaciones son hechos; por lo tanto debemos plantearnos si la información es cierta, está bien investigada, es cuestionable o faltan evidencias.
El diseño de la página es la primera impresión visual que tenemos de ella. Debe ser clara en su visualización. El texto tendrá un tamaño suficiente para que se lea sin dificultad. Las imágenes y fondo, deberán ser siempre complementos de mejora y no motivos principales. La presencia del índice es fundamental, y debe estar bien situado, de forma que podamos acceder y movernos por las distintas opciones sin perdernos.
No se sabe con exactitud la cantidad de información digital que existe actualmente
en Internet. Se estima que en 1999 había 800 millones de páginas, en cerca
de 3 millones de servidores. Se estima que cada día se añaden 7 millones
de páginas lo que representaría un crecimiento del 200% anual. Su extensión
es tan grande que solo el 50% se detecta por los buscadores tradicionales
y esta cobertura de búsqueda ha ido disminuyendo desde un 32% en 1998 al
16% en 1999. Si utilizamos los robots pueden llegan al 42%. Esta parte de
la información digital que, aún siendo accesible desde la red, no puede ser
indexado por los
motores de búsqueda se conoce como Web profunda “DeepWeb”.
Un ejemplo de este tipo de información lo constituyen las miles de bases
de datos y catálogos de bibliotecas disponibles. Se estima que existen entre
400 y 500 veces más información de la que se supone.
Otro problema inherente al volumen es la persistencia de la información ya que la vida media de las páginas en el Web es muy breve. La información queda obsoleta y desaparece, no quedando la mayoría de las veces en archivos o documentos históricos. Este hecho supone que los motores de búsquedas pueden llegar a ofrecer más del 20% de los enlaces muertos porque han desaparecido o cambiado de servidor de hospedaje. Aunque cabe destacar que la información científica es la que más persistencia tiene, sobre todo los artículos y publicaciones especializadas en formato definitivo.
Muchas personas piensan que la información hallada en Internet es buena, por el simple hecho de encontrarse ahí. Cualquier motor de búsqueda de Internet nos ofrece una cantidad enorme de información que es accesible al instante, pero la información de calidad puede quedar sepultada por montañas de basura. Por lo tanto, debemos tener presente que la información recibida no ha sido evaluada durante el proceso de búsqueda o selección.
Hay varias vías para buscar información en la red:
Mediante los diferentes sistemas de búsquedas podemos encontrar información autentificada y de buena calidad, pero esta información no necesariamente es pertinente en nuestro ámbito de búsqueda.
Los índices son directorios jerarquizados diseñados por personas que organizan la información por materias. En ellos y de forma manual, los recursos, se agrupan por secciones o categorías siendo un método selectivo y poco evaluativo.
Directorios académicos o no comerciales
Directorios comerciales
Utilizan robots que buscan por la red todo tipo de información y la almacenan en bases de datos. El problema fundamental de este tipo de búsqueda es que nos pueden inundar de información.
Son recopilaciones de índices en el primer caso y de motores de búsqueda en el segundo. La principal ventaja de los metabuscadores, es que permiten realizar búsquedas en varios motores desde una única dirección y página, en ocasiones con un cuadro de dialogo común
http://www.metacrawler.com (robot con varios buscadores)
Buscadores por índices o directorios:
Motores de búsqueda:
El futuro de la información de Internet: la Web Semántica.
La búsqueda de información en la Web, tal como la conocemos hoy, supone la mayoría de las veces un quebradero de cabeza y una inversión de tiempo considerable debido a la gran cantidad de información inconexa que hay. Basta hacer una búsqueda simple con cualquier buscador para obtener una enorme cantidad de páginas que no tienen nada que ver con el objetivo buscado, necesitando una selección manual por el usuario. Gran parte del problema de la Web es que ha sido diseñada por y para consumo humano y “utiliza un lenguaje que hace muy difícil su utilización por parte de las máquinas para el intercambio y elaboración efectiva de datos”. Además los buscadores actuales trabajan en entornos hostiles porque la enorme cantidad de servidores comerciales, tienen como objetivo que su página esté incluida en los primeros puestos de las búsquedas devueltas por el buscador por lo que emplean tretas para falsear su importancia. Los metadatos, aunque sin ser una solución óptima, han sido un avance en la identificación de la información. Se han establecidos criterios para mejorar la definición e identificación de los recursos electrónicos, el denominado Dublín Core, donde se definen 15 elementos (metadatos insertados en la cabecera del documento HTML) como son título, autor, materia, descripción, editor, lenguaje …etc. En un futuro próximo (posiblemente antes del año 2010) ya esté en pleno rendimiento la Web Semántica (Semantic Web).
Actualmente los desarrollos más avanzados para identificar la información que almacenan las páginas Web, ha venido de la mano de Tim Berners, que sido uno de los principales impulsores de un nuevo tipo de red: la Red Semántica. Con esta nueva tecnología lo que se pretende es que los datos sean comprendidos por las máquinas, sin la intervención de los humanos.
Eric Miller la define como "la Web Semántica es una extensión de la actual Web que permitirá encontrar, compartir y combinar la información más fácilmente...” [http://www.w3.org/2002/Talks/www2002-w3ct-swintro-em/]
Para que esto sea posible se necesita que la información sea introducida mediante un lenguaje que permita recoger diferentes Ontologías entendiendo por estas, un conjunto de definiciones de conceptos. Esta representación ontológica se expresa mediante lenguajes de Marco de Descripción de Recursos (RDF Resource Description Framework). Esta nueva Web será construida encima de la red actual valiéndose del RDF, en la cual la información esta dotada de significado de forma que permitan a las máquinas manejarlos de forma automatizada.
En el área de la medicina ya hay proyectos de desarrollo como HealthCyberMap. (http://healthcybermap.semanticweb.org/)
Internet es una herramienta (no un fin) que ofrece oportunidades de colaboración insospechadas en la comunicación e intercambio de información, rompiendo las fronteras y permitiendo una mayor colaboración en el campo científico y educativo. Dada su complejidad y su peculiaridad es necesario disponer de los conocimientos básicos que nos permitan utilizar sus ventajas y evitar sus inconvenientes, ya que posiblemente en los próximos años modificará, incluso sustituirá, algunas formas actuales de comunicación.
Actividad 1: Búsquedas de información.
Actividad 2: Analizar la calidad de la información.
Actividad 3: Compartir Información.
(Recuerda que estas actividades puedes ampliarlas utilizando tus propios recursos.)