Seminario Español de búsqueda-recuperación de información

En un mundo globalizado como el de hoy, la información es uno de los bienes más preciados e importantes y sobre el cual gira la economía; las grandes empresas y países desarrollados lo que manejan es conocimiento e información y sobre eso gira su desarrollo; en la parte académica las cosas son muy parecidas por cuanto las grandes universidades de Estados Unidos y de los países industrializados fomentan y apoyan los procesos de investigación siendo la base de su desarrollo futuro; en Latinoamérica los procesos de investigación y de apoyo en las aulas y las políticas de desarrollo son muy escasos y de ahí el gran abismo entre países del primer mundo y tercer mundo.

Actualmente en nuestro país se está empezando a cambiar esa cultura y las universidades están enfocando sus esfuerzos a fomentar los procesos investigativos y fortaleciendo las competencias de los estudiantes y de los futuros investigadores en esta área; las redes de bibliotecas universitarias manejan diferentes esquemas para que estos procesos de investigación sean más prácticos para el estudiante.

La mayoría de las bibliotecas tienen procesos de formación en búsqueda y recuperación de información, que es un tema en el cual es estudiante universitario tiene grandes falencias en la búsqueda de información, y el proceso de investigación se vuelve tedioso; es precisamente ahí donde las bibliotecas universitarias tienen que hacer una gran difusión en cómo llevar a cabo una búsqueda de información.

Algunas bibliotecas lo hacen mediante la inducción en las búsquedas de información básica y avanzada, son servicios de referencia, solicitud de información online; y en fin las diferentes formas de buscar y recuperar información en la red, bases de datos, catálogos en línea, buscadores y meta buscadores como el que actualmente tiene RUMBO. En España se están llevando a cabo seminarios y encuentros de las formas, procesos y las diferentes estrategias en la búsqueda y recuperación de información; iniciativas que deberíamos aplicar en los centros universitarios y educativos y preferiblemente empezar estos procesos de formación de búsqueda de información e investigación en las escuelas.

Los motores de búsqueda y recuperación de información en Internet

Los motores de búsqueda y recuperación de información más utilizados actualmente son:

Yahoo, AllTheWeb, Google, AltaVista, AOL Search, Ask Jeeves, Excite, HotBot//, Infoseek, Teoma; solo algunos permiten manejar búsqueda de gran complejidad y resultados aceptables, tal vez el más importante es Google que utiliza operadores boléanos y lógicos y formularios de búsqueda avanzada que permiten filtrar la búsqueda de información para que sean más exactos y precisos los resultados.

Todos los motores de búsqueda tienen tres elementos o comunes como son:
 
1. Robot. Es un programa desarrollado específicamente para "navegar" la red de vínculo en vínculo.

2. - Index. Es una base de datos que contiene una copia completa o parcial de los documentos reunidos por el robot.

3. - Mecanismo de búsqueda. Es un programa que permite al usuario indagar en la base de datos a partir de una página web y que entrega los resultados de la búsqueda, habitualmente ordenados según el criterio establecido.

Búsqueda y recuperación de información

En la actualidad la búsqueda y recuperación de información y almacenamiento tiene ventajas por cuanto existen herramientas que facilitan esta labor como lo son los motores de búsqueda y entre los buscadores más comunes y usados tenemos a Google, Infoseek, WebCrawler; los motores de búsquedas permiten localizar la información a través de unos índices de donde el recupera la información mediante unas palabras claves.

El problema de hoy día radica en cómo se almacena la información como se recupera en la búsqueda y como se recupera en 10 años cuando el software, soporte y formatos están en constante cambio es algo a tener en cuenta.

“El orden de aparición de los registros depende de una calificación que otorga el programa a cada página web cuando realiza la búsqueda. De manera general, el orden responde a la cantidad de veces que la página contiene la palabra introducida, aunque este criterio varía para cada buscador.”1

Una aproximación al concepto de recuperación de información en el marco de la ciencia de la documentación

Salvador Olivan y Arquero Avilés son dos autores que intentan aproximar un concepto completo y aproximado hacia la recuperación de información desde la perspectiva de las ciencias de la documentación. Vale la pena revisarlo: Una aproximación al concepto de recuperación de información en el marco de la ciencia de la documentación. 

búsqueda y recuperación de información

Este es un artículo que muestra de forma sencilla el entorno en el que se desenvuelve la búsqueda y recuperación de información hoy día con el nuevo sistema de información dsitribuido como es la web.

Les comparto un fragmento de su introducción:

"Internet no es sólo una red, sino una red de redes que engloba bajo su extenso manto una inmensa cantidad de información referente a cualquier tema que podamos imaginarnos. Para buscar en esta inmensidad no existen archivos ni servidores centrales, sino que la información esta dispersa en el ciberespacio infinito. Por este motivo, la búsqueda de información puede resultar una tarea ardua y frustrante. Para paliar dicho problema se presentan a continuación las herramientas y servicios que facilitan la tarea de búsquedas en Internet."

Consulten el artículo completo en el siguiente link: Búsqueda y recuperación de información

Elementos visuales en sistemas de búsqueda y recuperación de información

En este artículo la Profesora Mari Carmen Marcos nos muestra los elementos visuales existentes en los sistemas de búsqueda y recuperación de información. El texto está dividido en 6 puntos muy cortos pero puntuales, que permiten dar un visión clara sobre el proceso y las herramientas que se utilizan para la búsqueda y recuperación de información.

búsqueda y recuperación de información en las historias clínicas informatizadas

En el actual escenario de consolidación de los sistemas de información una aproximación interdisciplinar al análisis de la información clínica recogida en los sistemas de documentación sanitaria informatizada nos permite hacer una propuesta de modelización como un recurso para la discusión de casos entre profesionales en el contexto de la celebración de sesiones clínicas.

La metodología empleada se asienta por un lado en el análisis de la estructura de la propia sesión clínica y por otro en el empleo de herramientas de recuperación de la información existente pero empleadas habitualmente en el uso de la web. Como resultado se obtiene un modelo inicial de recuperación de información así como formulas estándar de búsqueda para la comparación documental, siendo necesario su desarrollo operativo.



BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN EN INTERNET

La colosal cantidad de información que alberga la red de redes puede convertirse, contra natura, en el amigo traicionero del que todo navegante ávido de conocimiento debería desconfiar. Adentrarse en Internet y dar con la aguja en el pajar a golpe de 'click' no es una simple cuestión de suerte. Existen numerosas herramientas y técnicas diseñadas para guiar al internauta en su búsqueda.

La información especializada en Internet. Directorio de recursos de interés académico y profesional [2ª ed. corregida y aumentada] es una guía de gran utilidad para todo aquel que tenga algo que buscar en la Web, ya sea profesional de la información y la documentación o usuario ocasional de la Red.

Concepto de recuperación de información

Cuando un usuario se plantea la necesidad de obtener nueva información sobre un asunto o materia de su interés, está manifestando una carencia, una situación irregular de sus estructuras mentales y cognitivas. Belkin, Oddy y Crofts han hablado de ASK, o "Anomalous State of Knowledge" (BELKIN, ODDY y CROFTS, 1982), un estado mental de incertidumbre que mueve al individuo a desarrollar una serie de acciones para salir de ese estado. Ingwersen deduce la existencia de un problema personal de espacio, "problem space" (INGWERSEN, 1992), por la diferencia entre el estado actual del conocimiento del usuario, y del estado que sería necesario para solucionar algún tipo de necesidad planteada. La respuesta a este tipo de situaciones es un conjunto de actividades que desarrolla el individuo para salir del estado anómalo, o para solucionar su problema de espacio, actividades que están íntimamente relacionadas con la adquisión de nueva información, y con el proceso comunicativo pertinente.

La recuperación de información es el conjunto de tareas mediante las cuales el usuario localiza y accede a los recursos de información que son pertinentes para la resolución del problema planteado. En estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental, etc. (CROFT, 1987) Todos estos factores ya han sido tratados exhaustivamente por la bibliografía especializada, por lo que no resulta necesario insistir sobre ellos en este lugar. Sin embargo, si es necesario recordar, como se ha señalado en la introducción, que la informatización de estas tareas se engloba dentro del campo de la Documentación Automatizada o Informática Documental.
 
Consulte el artículo original la recuperación de información

Visualización y recuperación de información

Resumen: En el presente trabajo se realiza un análisis y evaluación de los modelos de Interfaces Visuales de Recuperación de Información actualmente con mayor número de implementaciones en la World Wide Web. Para la realización del análisis se propone un sencillo esquema basado en las funciones principales que deben cumplir estas interfaces: Resumir la información, Resaltar la información más relevante, Relacionar la información similar y Recuperar la información.

búsqueda y recuperación de información

La busqueda y recuperación de la información se realiza teniendo en cuenta tal vez uno de los pasos más importantes para lograr que la información pueda ser encontrada de forma ágil y precisa; lo que plantea Jacques Chaumier, quien afirma en su libro que el proceso más importante es la indización la cual tiene dos características principales que son proceso y finalidad.

Proceso:. Desde la primera posición, la indización es la descripción y la caracterización del contenido de un documento, con la ayuda de las representaciones de los conceptos;

Finalidad: Es posibilitar la recuperación de la información almacenada en el sistema.

búsqueda y recuperación de información: Metadatos

El desarrollo de la teoría de los metadatos alcanza mayor auge con el avance de internet y la necesidad de describir los recursos de información digitales en procura de su localización y recuperación donde la metadata juega un papel importante.

“Se abordan aspectos relacionados con los recursos digitales y sus características, los metadatos, su definición, tipos y funciones; así como los tipos de metadatos más frecuentes en HTML y su relación con el lenguaje controlado.”

En este artículo se encuentran algunos conceptos rescatables en el proceso de recuperación en la web o en cualquier sistema o medio electrónico o digital; y la importancia de la descripción de los contenidos y las palabras claves sobre las cuales se puedan efectuar y recuperar la información.

En cuanto al metalenguaje tal vez el que más llama la atención es la utilización de XML como un modelo estándar donde la información puede permitir que las búsquedas sean más exactas y de mayor calidad.

búsqueda y recuperación de información: Artículo Ley de la Miopía en la búsqueda de información

El propósito de las páginas web es que puedan ser visibles y sean consultadas para la población objetivo a la cual va dirigida y sobre la cual se diseño; pero para esto tenemos que haber analizado e investigado como el usuario final realiza su búsqueda de información; tenemos que de antemano usar unas palabras clave que faciliten la recuperación de información utilizando el lenguaje y expresiones propias de cómo la gente buscaría la información.

Esta forma de diseñar las páginas permitiría que las búsquedas fueran más precisas lo cual redundaría en un mayor uso de las páginas que se estructuran de esta forma.
Se han formulado varias leyes tesis acerca del comportamiento para entender la forma como la gente se puede comportar cuando busca algo en la web, y de cómo este comportamiento evoluciona y cambia de acuerdo al resultado de sus búsquedas.

Algunas leyes que se formulan en el documento son:

“El significado de saber ha cambiado de ser capaz de recordar y repetir información a ser capaz de encontrarla y usarla. (Herbert Simon)”1

“No guardes nunca en la cabeza aquello que te quepa en un bolsillo.
(Albert Einstein)”2

Primera ley de la gestión y archivo de documentos
(Alfred Mauri)

“Toda persona u organización tiende a aplicar técnicas y principios archivísticos a la documentación que utiliza y produce solamente cuando ya ha perdido el control sobre ella”.3

Busqueda y Recuperación de Información: Repositorios Institucionales

1. Es un disco duro o servidor virtual donde almacenamos la producción científica de una institución, en forma digital ya que se encuentra en la nube, término usado para internet, donde se puede buscar y recuperar información para que pueda utilizarse, ya sea a nivel nacional o internacional.

Un repositorio permite importar, identificar, almacenar, preservar, recuperar y exportar información desde un portal web. Mediante etiquetas se estructura el documento para que la maquina pueda recuperar la información.

-RI sistema de gestión de contenidos
-RI es una vía de comunicación científica, más no un canal de publicación; con revisión por pares. 

Las colecciones incluyen la producción científica (artículos, tesis, comunicaciones, etc.), los objetos para la enseñanza.

Objetivos:

- La generación de conocimiento
- La habilidad de recoger, organizar, preservar y compartir información a través del uso de tecnologías.
- Es lograr que la institución sea visible en el ámbito nacional e internacional por medio de la calidad de sus investigaciones y producción científica.
- Lograr una mayor competitividad.
- El objetivo principal de esta herramienta es conservar, difundir y hacer accesible a todas las investigaciones realizadas en una institución.

2. En un concepto muy personal el RI es un sitio en la red donde se hace visible toda la actividad institucional en cuanto a su producción científica lograda por medio de sus investigaciones y en la cual ese acceso es de forma libre, para todo usuario con acceso a internet.

Otras Definiciones:

(La Universidad Autónoma de Madrid 2007) precisa que un repositorio institucional es conjunto de servicios Web centralizados, creados para organizar, gestionar, preservar y ofrecer acceso libre a la producción científica, académica o de cualquier otra naturaleza cultural, en soporte digital, generada por los miembros de una institución.

(Suber 2005) define “Repositorio Institucional” Como “digital collections capturing and preserving the intellectual output of a single university or a multiple institution community of collegues and universities.

(Iazza 2005)Un repositorio institucional (RI) es el conjunto de servicios ofrecidos por una institución con el objeto de gestionar, difundir, y facilitar el acceso a cualquier persona con conexión a Internet, a aquellos documentos electrónicos creados por dicha institución y por aquellas personas que forman parte de ella.


Recuperado: Agosto 26 de 2010 a las 10:31 a.m. Biblios: Revista de Bibliotecología y Ciencias de la Información, Núm. 31, abril-junio, 2008, pp. 1-11. Julio Santillán Aldana, ed. Lima, Perú.

3. Propósito de los Repositorios Institucionales: 

- Gestionar educación, investigación y recursos de forma efectiva y transparente.
- Hacer que la investigación y la producción científica se encuentren disponibles
- Desarrollar relaciones entre los académicos y los centros de investigación, nacionales e internacionales.
- Estimular la economía y el desarrollo social.
- Un entorno pedagógico rico en información, centrado en el estudiante
- Permitir la masificación, socialización y difusión de información, que muchas veces se pierde en revistas de literatura gris o colegios invisibles como se les denomina en algunos casos.
- Los repositorios ayudan a las instituciones a desarrollar métodos coordinados y coherentes para la captura y explotación de su producción científica.
- Los RI estimulan el cambio cultural en los procesos pedagógicos de enseñanza y aprendizaje.


Búsqueda y Recuperación de Información: Derechos de Autor

busqueda de información“El copyright hace referencia a los derechos de explotación sobre una obra original, en los cuales se incluyen los de distribución, reproducción y uso de la misma.”1

Los derechos de autor nacieron para proteger la propiedad intelectual y controlar el uso inadecuado; pero en un mundo globalizado donde la economía, política, educación, etc.; giran en torno a la información que se transforma en conocimiento, los cuales son los ejes de desarrollo de los países industrializados el tema adquiere una mayor relevancia. Se están haciendo grandes esfuerzos para que toda esa producción científica que se publica en las diferentes revistas sean de acceso libre mediante el uso licencias Creative Commons donde el autor establece los criterios para la reutilización de su trabajo reconocimiento, uso no comercial, etc.

Se observa en los autores una contradicción entre sus actitudes y hábitos, por un lado el autor busca un reconocimiento al ser publicado por grandes revistas, pero por otra parte desde el punto de vista lector común son muy claros en que el acceso a ese material no tenga restricciones y serian coherentes con los objetivos que buscan los repositorios y el movimiento open Access; las recomendaciones o conclusiones más importantes que rescataría de la lectura son:

- El proceso de evaluación peer review es muy importante en el mantenimiento de la calidad de las publicaciones.
- Las descargas de archivos puede ser un buen indicador del impacto de un trabajo.
- Ignorancia sobre el movimiento open access en general.
- Miedo a la falta de control sobre artículos depositados en repositorios (plagio, conflictos de interés, dudas sobre la calidad del medio).

En resumen hay un camino que recorrer en el cambio de habito de los autores y en generar una cultura que apoye el libre acceso a toda a la información y en especial a la producción científica, que verdaderamente impacte a otros y sea la base para la generación de nuevas investigaciones que por su calidad deban ser visibles en dichos repositorios.