Publicidad
Comparte esto en:

Elicit está construyendo una herramienta para automatizar la revisión de la literatura científica

Para los investigadores, leer artículos científicos puede llevar mucho tiempo. Según una investigación, los científicos dedican siete horas a la semana a buscar información. Otras investigaciones sugieren que las revisiones sistemáticas de la literatura (síntesis académicas de evidencia sobre un tema específico) toman un promedio de 41 semanas para un equipo de investigación de cinco personas.

Pero no es necesario que sea así.

Publicidad

Al menos ese es el mensaje de Andreas Stuhlmüller, cofundador de una startup de inteligencia artificial. Obtener, que diseñó un “asistente de investigación” para científicos y laboratorios de I+D. Con patrocinadores como Fifty Years, Basis Set, Illusion e inversores ángeles Jeff Dean (científico jefe de Google) y Thomas Ebeling (ex director ejecutivo de Novartis), Elicit está construyendo una herramienta impulsada por inteligencia artificial para abstraer los aspectos más tediosos de la revisión de la literatura. .

«Obtener es un asistente de investigación que automatiza la investigación científica con modelos de lenguaje”, dijo Stuhlmüller a TechCrunch en una entrevista por correo electrónico. «Específicamente, automatiza la revisión de la literatura, encuentra artículos relevantes, extrae información importante sobre los estudios y organiza la información en conceptos».

Publicidad

Elicit es una empresa con fines de lucro creada por Ought, una fundación de investigación sin fines de lucro lanzada en 2017 por Stuhlmüller, ex investigador del Laboratorio de Computación y Cognición de Stanford. El otro cofundador de Elicit, Jungwon Byun, se unió a la startup en 2019 después de liderar el crecimiento de la empresa de préstamos en línea Upstart.

Utilizando una variedad de modelos propios y de terceros, Elicit busca y descubre conceptos en artículos, lo que permite a los usuarios hacer preguntas como «¿Cuáles son todos los efectos de la creatina?» o «¿Cuáles son todos los conjuntos de datos que se han utilizado para estudiar el razonamiento lógico?» y obtener una lista de respuestas de la literatura académica.

«Al automatizar el proceso de revisión sistemática, podemos ofrecer inmediatamente ahorros de tiempo y costos a las organizaciones de investigación académicas e industriales que producen estas revisiones», dijo Stuhlmüller. «Al reducir el costo lo suficiente, desbloqueamos nuevos casos de uso que antes tenían un costo prohibitivo, como actualizaciones justo a tiempo cuando cambia el estado del conocimiento en un campo».

Pero espera, podrías decir: ¿no tienen los modelos lingüísticos una tendencia a inventar cosas? De hecho lo hacen. El intento de Meta de crear un modelo de lenguaje para acelerar la investigación científica, Galácticofue retirado apenas tres días después del lanzamiento cuando se descubrió que el modelo hacía referencia con frecuencia a artículos de investigación falsos que parecían correctos pero que en realidad no eran objetivos.

Sin embargo, Stuhlmüller afirma que Elicit ha tomado medidas para garantizar que su IA sea más confiable que muchas de las plataformas especialmente diseñadas.

Por un lado, Elicit divide las tareas complejas que realizan sus modelos en partes «comprensibles para los humanos». Esto le permite a Elicit saber, por ejemplo, con qué frecuencia diferentes modelos inventan cosas cuando generan resúmenes y, posteriormente, ayuda a los usuarios a identificar qué respuestas verificar y cuándo.

Elicit también intenta calcular la “confiabilidad” general de un artículo científico, teniendo en cuenta factores como si los ensayos realizados en la investigación fueron controlados o aleatorios, la fuente de financiación y los posibles conflictos, y el tamaño de los ensayos.

Obtenga una herramienta de búsqueda de literatura sobre IA.

«No creamos interfaces de chat», dijo Stuhlmüller. «Hacer que los usuarios apliquen modelos de lenguaje como trabajos por lotes… Nunca generamos respuestas utilizando modelos, siempre vinculamos las respuestas a la literatura científica para reducir las alucinaciones y facilitar la verificación del trabajo de los modelos».

No estoy necesariamente convencido de que Elicit haya resuelto algunos de los principales problemas que afectan a los modelos lingüísticos actuales, dada su intratabilidad. Pero sus esfuerzos ciertamente parecen haber despertado el interés –y tal vez incluso la confianza– de la comunidad científica.

Stuhlmüller afirma que más de 200.000 personas utilizan Elicit cada mes, lo que representa un crecimiento interanual tres veces mayor, de organizaciones como el Banco Mundial, Genentech y Stanford. «Nuestros usuarios piden pagar por funciones más potentes y ejecutar Elicit a mayor escala», añadió.

Presumiblemente, fue este impulso el que condujo a la primera ronda de financiación de Elicit: un tramo de 9 millones de dólares liderado por Fifty Years. El plan es destinar la mayor parte del dinero nuevo al desarrollo del producto de Elicit, así como a ampliar el equipo de gerentes de producto e ingenieros de software de Elicit.

Pero ¿cuál es el plan de Elicit para ganar dinero? Buena pregunta, y se la hice a Stuhlmüller sin rodeos. Señaló el Teir pago de Elicit, lanzado esta semana, que permite a los usuarios buscar artículos, extraer datos y resumir conceptos en una escala mayor que la que admite el nivel gratuito. La estrategia a largo plazo es convertir a Elicit en una herramienta general de investigación y razonamiento, una herramienta por la que empresas enteras pagarían.

Un obstáculo potencial para el éxito comercial de Elicit son los esfuerzos de código abierto, como el Modelo de Lenguaje Abierto del Instituto Allen de IA, que tiene como objetivo desarrollar un gran modelo de lenguaje libre optimizado para la ciencia. Pero Stuhlmüller dice que ve el código abierto más como un complemento que como una amenaza.

«La principal competencia en este momento es el trabajo humano: asistentes de investigación que son contratados para extraer meticulosamente datos de los documentos», dijo Stuhlmüller. “La investigación científica es un mercado enorme y las herramientas de flujo de trabajo de investigación no tienen tareas importantes. Aquí es donde veremos surgir flujos de trabajo de IA completamente nuevos”.

Publicidad


Comparte esto en:
Publicidad

Publicaciones Similares

Deja un comentario