Por qué SamSam · 50 papers académicos en 2 segundos sin pelear con Google Scholar
Google Scholar es la herramienta que casi todo investigador hispanohablante usa por default · y casi nadie cuestiona. Pero detrás de su interfaz limpia hay una caja negra que cambia su ranking sin documentación, banea cuentas que intentan automatizar búsquedas, y nunca expone una API pública. La buena noticia: existe un stack de 3 bases académicas abiertas que combinadas indexan más de 250 millones de papers, devuelven resultados estructurados en JSON, y son gratis. Aquí explicamos por qué nos tomamos una tarde para construir SamSam.
El problema con Google Scholar
Google Scholar es asombroso por su cobertura — desde papers chinos sobre maíz transgénico hasta tesis de derecho boliviano están ahí. El problema no es lo que tiene, es cómo te lo da:
- No tiene API pública. Si automatizas búsquedas con scraping, Scholar bloquea tu IP en pocos minutos. Esto significa que cualquier herramienta seria que dependa de Scholar es frágil por diseño.
- Su algoritmo de ranking es opaco. Mezcla relevance, citations, recency y SEO de la página universitaria con pesos que nunca explica. Dos búsquedas idénticas pueden dar resultados distintos según tu historial, ubicación y dispositivo.
- No te da metadata limpia. Para citar un paper tienes que clickear, esperar, copiar BibTeX, pegar. Multiplica eso por 30 papers de una revisión sistemática.
- No filtra por DOI. Aparecen el mismo paper publicado en 5 sitios distintos como 5 entradas diferentes.
Si te dedicas a la investigación, todo esto es overhead invisible que se come horas todas las semanas.
El stack abierto que nadie usa fuera del mundo bibliotecario
Mientras Google Scholar se mantiene cerrado, otras tres bases académicas decidieron lo contrario y publicaron APIs abiertas gratis:
| Base | Cobertura | Quién la mantiene | API |
|---|---|---|---|
| Semantic Scholar | ~200M papers · fuerte en CS, biomédica, ingeniería | Allen Institute for AI | JSON REST · gratis · sin key requerida |
| Crossref | ~140M registros con DOI · todas las disciplinas | Consorcio de editoriales académicas | JSON REST · gratis · sin key |
| OpenAlex | ~250M obras académicas · sucesor de Microsoft Academic | OurResearch (nonprofit) | JSON REST · gratis · 100K calls/día |
Estas bases son lo que usa la infraestructura académica seria — desde Mendeley hasta universidades top — pero casi ningún investigador individual las consulta directamente porque sus interfaces son austeras y técnicas.
La metadata académica está disponible y abierta. El problema es que nadie la masticó para investigadores hispanohablantes que quieren respuestas, no JSON crudo.
Qué hace SamSam exactamente
SamSam es una capa fina sobre esas tres APIs. Cuando escribes un tema, en paralelo:
- Pulla 100 papers de Semantic Scholar
- Pulla 100 papers de Crossref
- Pulla 100 papers de OpenAlex
Luego deduplica por DOI (un mismo paper aparece en las 3 bases con metadata distinta · SamSam consolida lo mejor), aplica un ranking que combina citations + recency + match con tu journal target, y te devuelve:
- Top 50 papers · ordenados, con título, autores, año, journal, citas, abstract, DOI
- Outline sugerido · plantilla de secciones según la disciplina (economía, derecho, medicina, etc.)
- Top journals candidatos · revistas donde el tema se está publicando hoy
- Frontier · los papers más recientes (últimos 18 meses) para identificar gaps activos
Todo en ~2 segundos, gratis, sin login, en español, inglés, francés y catalán.
Lo que SamSam NO es
Sería deshonesto no decirlo: SamSam no es ChatGPT ni Elicit ni Consensus. No interpreta el contenido de los papers, no te genera resúmenes con LLM, no extrae conclusiones, no hace meta-análisis automático.
Eso es deliberado por dos razones:
- Costo cero. Los servicios LLM cuestan dinero por consulta. SamSam es gratis porque solo hace búsqueda + ranking, sin LLM externo en la respuesta básica.
- Confiabilidad. El LLM puede alucinar referencias inexistentes. SamSam te garantiza que cada paper que ves existe y tiene un DOI verificable. Lo que hagas con esos papers es tu trabajo.
Si en algún momento necesitas curaduría humana profunda — alguien que lea los 50 papers, identifique gaps comerciales, recomiende journals con factor de impacto, y te entregue un PDF profesional listo para tu director de tesis — está disponible como análisis profundo opcional con Claude Opus + curaduría humana en 24-48h. Pero la versión gratis te lleva 80% del camino.
Cómo lo construimos
SamSam se construyó en una tarde. El stack es deliberadamente simple:
- Frontend: HTML + CSS + JavaScript vanilla. Sin framework. Sin build step. 1 archivo.
- Backend: Flask Python serverless en Vercel. ~200 líneas. 3 functions de búsqueda + 1 de health.
- i18n: objeto JSON en JavaScript con 4 idiomas. Switch instantáneo sin recargar.
- Hosting: Vercel Hobby (gratis hasta 100K requests/mes).
- Dominio: samsam.canrullan.com (CNAME a Vercel).
Sin base de datos. Sin autenticación. Sin tracking. Sin LLM en la versión free. Cero costo recurrente. La filosofía: que cualquiera pueda replicar lo mismo con cualquier API académica abierta — el código está ahí para inspirar, no para enclaustrar.
A quién sirve esto
SamSam fue construido pensando en investigadores específicos:
- Doctorantes que están armando marco teórico y necesitan ver el estado del arte rápido
- Profesores que evalúan si un tema es viable como línea de investigación nueva
- Estudiantes de licenciatura/maestría preparando tesis de grado
- Periodistas científicos verificando contexto antes de publicar una nota
- Consultores de policy, derecho, finanzas que necesitan literatura validada en 5 minutos antes de una reunión
No fue construido para machine learning researchers que necesitan datasets gigantes (para eso S2 expone su API directo, sin necesitar SamSam) ni para meta-análisis que requieren screening manual de cada paper. Para esos casos, herramientas como Covidence o Rayyan son mejores opción.
Qué viene
Esta es la versión 0.5. Hay 7 herramientas más en la encuesta del sitio que la comunidad puede priorizar votando. Las que más voten salen primero. Algunas en mente:
- Lector de PDF · subes un paper, te da resumen + contribución + cita lista
- Generador de citas · pegas DOI/URL → APA/MLA/Chicago
- Comparador de papers · matriz de hipótesis · método · hallazgos
- Simulador de peer review · lee tu draft como reviewer 2 hostil
- Búsqueda de grants · convocatorias activas en tu área
- Revisión académica integral · citas · ortografía · plagio
Pruébalo
Búsqueda académica · 50 papers en 2 segundos · gratis · sin login. Pruébalo con un tema de tu área y ve qué encuentras.
→ Ir a la herramientaSamSam es un experimento. Si te sirve, votar en la encuesta del sitio nos dice qué construir después. Si no te sirve, dinos por qué — la encuesta tiene un campo abierto. La meta no es que SamSam sea perfecto; es que la investigación académica deje de ser un cuello de botella tecnológico para gente que tiene preguntas mejores que su tiempo disponible.
← Todos los artículos