Saturday, July 12, 2008

Motores de búsqueda para computadoras personales

Los motores de búsqueda han revolucionado la manera de trabajar en Internet al organizar la información disponible y estructurarla de manera que sea accesible. Se han convertido en la columna vertebral de la Web al organizar información proveniente de millones de fuentes en decenas de formatos diferentes.

En contraste, en el escritorio las cosas se tornan difíciles pues según algunas fuentes, hasta el 80% de la información en las computadoras personales no está organizada. Hasta muy recientemente, los sistemas operativos no ofrecían más facilidades para encontrar archivos que por su nombre y por cadenas de texto en su contenido. No había manera de encontrar imágenes por su contexto o de buscar información dentro de archivos binarios; a menos que el formato viniera del mismo fabricante del Sistema operativo. Este mismo problema se extiende a las organizaciones, pues en muchos de los casos no hay un sistema o políticas que definan la manera de almacenar, organizar y encontrar la información. Existe información duplicada, falta de coordinación entre departamentos o unidades de negocio que pueden trabajar con versiones diferentes o contradictorias del mismo documento, información inaccesible, burocracia, información confidencial que se filtra al exterior, y demás problemas.

Para ayudar a organizar y hacer accesible la información en las computadoras personales, existen motores de búsqueda para el escritorio (Desktop Search). Estos programas permiten indexar los archivos en el equipo para su posterior búsqueda. Su alcance puede ser local (sólo dentro el equipo de cómputo), organizacional (permiten encontrar archivos dentro de una red local u organización) o global (permiten encontrar un documento en un equipo específico desde un equipo remoto). También es posible que se interconecten con otras herramientas de Business Intelligence para buscar dentro de repositorios o bases de datos a donde el usuario tenga permisos.

La búsqueda en el escritorio funciona de la siguiente manera:
  • El motor de búsqueda explora el sistema de archivos, generalmente en periodos de inactividad, e indexa los documentos que encuentra. También indexa los archivos nuevos o modificados.
  • De estos archivos; guarda su nombre y ruta de acceso; extrae metadatos como el nombre del autor, el idioma o comentarios; filtra el contenido, de manera que pueda extraer e indexar los datos en un formato uniforme y compatible con los datos provenientes de otros tipos de archivos diferentes e incompatibles en su formato original
Las últimas versiones de los sistemas operativos vienen ya con algún tipo de búsqueda local como Windows Search en Windows Vista, SpotLight en Mac OS X Tiger, o Tracker en Ubuntu Linux. También puede ser una aplicación que se instale por separado, como en el caso de Google Desktop.

Labels: , , , ,

Sunday, November 4, 2007

Cambiando Paradigmas: Gestión de Documentos ofimáticos

En estos días todavía muchas empresas administran sus procesos utilizando los tradicionales documentos ofimáticos (procesadores de texto, hojas de cálculo, presentaciones). Esta manera de trabajar presenta algunos inconvenientes como:
  • Duplicidad. Diversas personas almacenan, manejan y editan el mismo documento
  • Inconsistencia. Los usuarios hacen modificaciones en diferentes versiones del mismo documento.
  • Incompatibilidad. Un mismo documento puede ser incompatible entre suites ofimáticas libres y propietarias así como entre diverentes versiones de un mismo software.
  • Un archivo dañado puede ser difícil de recuperar.
  • No hay un control de versiones de los documentos.
  • No hay un repositorio central de documentos.
  • No hay niveles de acceso o permisos para acceder a los documentos.

Muchos de estos inconvenientes en el manejo de documentos pueden resolverse facilmente con un sistema EDRM. Los procesos pueden modificarse para no depender de este tipo de archivos implementando por ejemplo un sistema de Administración de la Cadena de Suministro. Pero es posible que una compañía no tenga la necesidad, el dinero o los recursos humanos para implementar un sistema más complejo. En este caso existen alternativas para administrar documentos algunas de ellas son:

Google Documents. Es una suite ofimática basada en plataforma AJAX, por lo que trabaja en el navegador web y no se tiene que descargar o instalar en la computadora. Esta suite permite crear y editar archivos de texto, hojas de cálculo y presentaciones, exportarlos a diferentes formatos y descargarlos. También permite a otros usuarios editar los mismos archivos, por lo que se tiene un control básico de versiones y permisos de acceso. Por último también permite publicar los documentos para que estén disponibles a cualquier usuario a través de una URL.

Scribd. Es una red social que permite compartir documentos en diversos formatos. La característica más importante es la capacidad de esta herramienta de convertir un documento a múltiples formatos, como texto plano, html, documento de texto, archivo PDF o archivo MP3. Los documentos que se suban a Scribd no son editables, pero son fáciles de distribuir a trvés de la dirección electrónica (URL) o insertándolos en una página web a través de un reproductor flash.

Docstoc. Sitio similar a Scribd, pero orientado a documentos profesionales como plantillas, formularios, contratos, etc. Las categorías son más rígidas y los documentos no son convertidos a múltiples formatos, sino que conservan su formato original como documento de texto, presentación, etc. Al igual que Scribd, los documentos pueden compartirse usando un reproductor flash con el código obtenido en la página del documento.

Edocr. Otro sitio similar a Scribd o Docstoc. La diferencia es que este sitio solamente admite documentos de texto (.doc) y archivos .pdf. Al igual que los otros, los documentos se pueden compartir usando el código para reproductor flash.

Labels: ,