Históricamente, la importante editorial Elsevier fue la primera en detectar que existía una nueva necesidad de información académica en la Web y que, por tanto, se necesitaba una nueva clase de sistemas de información para la Web. En concreto, Elsevier concibió un sistema capaz de indizar páginas web de manera automática, es decir, tal como lo hacen los motores convencionales, pero que fuera capaz de filtrar la información de manera que pudiera ser admisible y fiable para los estrictos criterios del mundo académico.
Ese producto se llamó Scirus (www.scirus.com) y, al parecer su éxito despertó suficientes recelos en Google para que esta empresa intentara una operación parecida, y así tuvimos unos pocos años después Google Scholar (scholar.google.com).
Por imitación (y para suerte del mundo académico) Microsoft no quiso ser menos y, desde inicios del 2007 contamos con un nuevo contendiente en este apasionante campo: Live Search Academic (academic.live.com).
La característica principal de los tres sistemas es que solamente indizan sitios web vinculados con el mundo académico. Qué se entiende por "mundo académico" cambia en cada caso. La perspectiva que combina, a la vez, rigor y máxima amplitud corresponde sin duda a Scirus. La perspectiva que se ciñe con el máximo rigor, pero en este caso a costa de la amplitud, corresponde a Live Search Academic y, en alguna posición intermedia, se encuentra Google Scholar.
Con el fin de poder presentar una comparativa entre los tres motores, proponemos la siguiente tipología de documentos académicos:
1. Tipo 1: Páginas web y documentos de todo tipo (Word, ppt, etc.) publicados en sitios de instituciones académicas o científicas (p.e., sitios del tipo.edu).
2. Tipo 2: Artículos de publicaciones científicas tipo peer review, ya se trate de publicaciones open acceso de publicaciones de pago.
3. Tipo 3: Trabajos académicos tales como tesis doctorales o tesis de licenciatura.
4. Tipo 4: Documentos depositados en repositorios científicos (e-prints) ya sean pre-pirnts, post-prints, materiales didácticos, etc.
5. Tipo 5: Patentes
6. Tipo 6: Libros (monografías
Scirus
El motor de búsqueda Scirus es, como ya se ha apuntado antes, una creación de la importante editorial de revistas científicas holandesa Elsevier (www.elsevier.com) que es parte, a su vez, del gigante editorial anglo-holandés Reed-Elsevier (www.reed-elsevier.com), editor de libros y revistas y productor de bases de datos como Lexis-Nexis.
La cuestión es que Elsevier parece haber comprendido muy bien importantísimo papel que la Web está jugando en la distribución de información académica y dispone de otras dos grandes bases de datos (en este caso y a diferencia de los motores que analizaremos aquí, dirigidas a su utilización en el contexto de bibliotecas universitarias): Science Direct (www.sciencedirect.com) y Scopus (www.scopus).
Scirus fue fundado en el año 2001 y, poco a poco ha ido ampliando su campo de acción incorporando sucesivamente nuevas fuentes hasta convertirse en un auténtico gigante y en el más completo sistema de los tres (Google Scholar y Windows Live). En un análisis realizado a finales del año 2006 (Jacsó, 2006) se constató que contenía más de 300 millones de documentos (empezó con 50 millones en 2001, de manera que ha multiplicado su contenido por seis desde entonces). Otros dos análisis previos (Giustini y Barksy, 2005; Doldi y Bratengeyer, 2005) confirmaron en su momento que Scirus era, con mucha diferencia más completo que Google Scholar (no existía Live en 2005) por lo que hacía a repositorios científicos del tipo American Physical Society o PubMed.
Google Scholar
Contexto
A estas alturas es difícil presentar a Google. Ha sido la empresa que ha revolucionado de tal manera la búsqueda en la Web que incluso ha acabado afectando a los hábitos de navegación. Por ejemplo, la mayoría de los internautas ya no utiliza los Preferidos del navegador: prefiere entrar el nombre de la web en la más famosa caja de búsqueda de la historia. Muchos tampoco entran ya una URL completa si ésta en medianamente complicada. Prefirieren entrar una parte del nombre de la web sabiendo que Google le llevará a ella, probablemente en el primer resultado. Ha empujado a los directorios generalistas, como Yahoo o Dmoz, prácticamente a la clandestinidad y ha barrido a los centenares de directorios nacionales e internacionales que existían antes del 2000. La influencia de Google se ha dejado sentir también en el primer modelo de negocio que ha sido capaz de generar beneficios en la Web: su sistema de anuncios AdWord y AdSense, imitado también por sus competidores.
Por último, prácticamente han creado (u obligado a desarrollar, según se mire) una rama de la matemática: el análisis de enlaces. Lo cierto es que son muchas cosas las que Google ha aportado a la Web. La cuestión es que, en su búsqueda incesante de nuevas actividades (siempre pensado en reforzar su modelo de negocio, no lo olvidemos), desde hace dos años Google se decidió a entrar en el mercado de los motores académicos y lanzó Google Scholar (Google Académico) con algunas ideas (relativamente) nuevas. La más importante, sin duda, la de llevar a la Web el análisis de citaciones (por eso decimos que era una idea relativamente nueva).
Live Search Academic
Contexto
Microsoft (la compañía propietaria de Live Search) tiene una curiosa historia con la Web: casi siempre llega tarde, pero acaba dominando todo o parte del sector. Les sucedió con los navegadores, con el correo electrónico y les ha sucedido con las búsquedas en la Web. Les ha vuelto a suceder con las búsquedas para objetivos académicos, es decir, en este caso se cumple solamente la primer parte: han llegado tarde. Lo que no sabemos es si acabarán dominado una buena parte del sector, como consiguieron hacer en el caso de los navegadores.
En todo caso, Microsoft es la única empresa del mercado informático que dispone de capacidad tecnológica y financiera suficiente para plantear un desafío creíble al líder actual de las búsquedas generalistas en la web (Google), por un lado, y al líder de las búsquedas académicas por otro (Scirus). Solamente una incomprensible lista de fracasos anteriores de Microsoft en este campo hace difícil pensar en su liderazgo a medio plazo, pese a los medios de que dispone