SamSam // BLOG
← Todos los artículos

Por qué SamSam · 50 papers académicos en 2 segundos sin pelear con Google Scholar

Google Scholar es la herramienta que casi todo investigador hispanohablante usa por default · y casi nadie cuestiona. Pero detrás de su interfaz limpia hay una caja negra que cambia su ranking sin documentación, banea cuentas que intentan automatizar búsquedas, y nunca expone una API pública. La buena noticia: existe un stack de 3 bases académicas abiertas que combinadas indexan más de 250 millones de papers, devuelven resultados estructurados en JSON, y son gratis. Aquí explicamos por qué nos tomamos una tarde para construir SamSam.

El problema con Google Scholar

Google Scholar es asombroso por su cobertura — desde papers chinos sobre maíz transgénico hasta tesis de derecho boliviano están ahí. El problema no es lo que tiene, es cómo te lo da:

Si te dedicas a la investigación, todo esto es overhead invisible que se come horas todas las semanas.

El stack abierto que nadie usa fuera del mundo bibliotecario

Mientras Google Scholar se mantiene cerrado, otras tres bases académicas decidieron lo contrario y publicaron APIs abiertas gratis:

BaseCoberturaQuién la mantieneAPI
Semantic Scholar~200M papers · fuerte en CS, biomédica, ingenieríaAllen Institute for AIJSON REST · gratis · sin key requerida
Crossref~140M registros con DOI · todas las disciplinasConsorcio de editoriales académicasJSON REST · gratis · sin key
OpenAlex~250M obras académicas · sucesor de Microsoft AcademicOurResearch (nonprofit)JSON REST · gratis · 100K calls/día

Estas bases son lo que usa la infraestructura académica seria — desde Mendeley hasta universidades top — pero casi ningún investigador individual las consulta directamente porque sus interfaces son austeras y técnicas.

La metadata académica está disponible y abierta. El problema es que nadie la masticó para investigadores hispanohablantes que quieren respuestas, no JSON crudo.

Qué hace SamSam exactamente

SamSam es una capa fina sobre esas tres APIs. Cuando escribes un tema, en paralelo:

  1. Pulla 100 papers de Semantic Scholar
  2. Pulla 100 papers de Crossref
  3. Pulla 100 papers de OpenAlex

Luego deduplica por DOI (un mismo paper aparece en las 3 bases con metadata distinta · SamSam consolida lo mejor), aplica un ranking que combina citations + recency + match con tu journal target, y te devuelve:

Todo en ~2 segundos, gratis, sin login, en español, inglés, francés y catalán.

Lo que SamSam NO es

Sería deshonesto no decirlo: SamSam no es ChatGPT ni Elicit ni Consensus. No interpreta el contenido de los papers, no te genera resúmenes con LLM, no extrae conclusiones, no hace meta-análisis automático.

Eso es deliberado por dos razones:

  1. Costo cero. Los servicios LLM cuestan dinero por consulta. SamSam es gratis porque solo hace búsqueda + ranking, sin LLM externo en la respuesta básica.
  2. Confiabilidad. El LLM puede alucinar referencias inexistentes. SamSam te garantiza que cada paper que ves existe y tiene un DOI verificable. Lo que hagas con esos papers es tu trabajo.

Si en algún momento necesitas curaduría humana profunda — alguien que lea los 50 papers, identifique gaps comerciales, recomiende journals con factor de impacto, y te entregue un PDF profesional listo para tu director de tesis — está disponible como análisis profundo opcional con Claude Opus + curaduría humana en 24-48h. Pero la versión gratis te lleva 80% del camino.

Cómo lo construimos

SamSam se construyó en una tarde. El stack es deliberadamente simple:

Sin base de datos. Sin autenticación. Sin tracking. Sin LLM en la versión free. Cero costo recurrente. La filosofía: que cualquiera pueda replicar lo mismo con cualquier API académica abierta — el código está ahí para inspirar, no para enclaustrar.

A quién sirve esto

SamSam fue construido pensando en investigadores específicos:

No fue construido para machine learning researchers que necesitan datasets gigantes (para eso S2 expone su API directo, sin necesitar SamSam) ni para meta-análisis que requieren screening manual de cada paper. Para esos casos, herramientas como Covidence o Rayyan son mejores opción.

Qué viene

Esta es la versión 0.5. Hay 7 herramientas más en la encuesta del sitio que la comunidad puede priorizar votando. Las que más voten salen primero. Algunas en mente:

Pruébalo

Búsqueda académica · 50 papers en 2 segundos · gratis · sin login. Pruébalo con un tema de tu área y ve qué encuentras.

→ Ir a la herramienta

SamSam es un experimento. Si te sirve, votar en la encuesta del sitio nos dice qué construir después. Si no te sirve, dinos por qué — la encuesta tiene un campo abierto. La meta no es que SamSam sea perfecto; es que la investigación académica deje de ser un cuello de botella tecnológico para gente que tiene preguntas mejores que su tiempo disponible.

← Todos los artículos