SamSam // BLOG

Redes de co-citación · qué papers debes leer en tu área sin perderte

Cuando dos papers son citados juntos sistemáticamente por un tercero, hay una relación intelectual entre ellos · aunque sus autores nunca se hayan leído. Esa intuición fundó el análisis de co-citación en 1973 y hoy es la herramienta más poderosa para no perderse en una literatura ajena.

El análisis de co-citación (Small, 1973) ofrece un método para identificar los trabajos seminales de un campo sin haberlo recorrido completo. Si dos papers son citados juntos repetidamente, comparten paisaje intelectual.

Tres aplicaciones operativas:

  • Mapas bibliométricos: VOSviewer y CiteSpace transforman miles de papers en visualizaciones navegables · clústeres temáticos y autores centrales.
  • Trabajos seminales: nodos de alto grado y betweenness en la red revelan los pocos papers que toda la conversación cita.
  • Frentes emergentes: burst detection (Kleinberg) identifica clústeres con citaciones que crecen rápido · señal temprana de tema candente.

El paper cierra con un cross-link al caso de cirugía estética basada en evidencia · misma metodología aplicada a un campo donde separar evidencia de marketing es decisión de paciente.

1. El problema de la literatura ajena

Quien entra a un campo nuevo enfrenta una asimetría dura · los miembros del campo conocen los cinco a diez papers que toda la conversación da por supuestos, mientras quien recién llega los desconoce. Empezar leyendo los más citados en Google Scholar funciona a veces, pero a menudo lleva a papers viejos sin contexto o a textbooks que repiten ortodoxia sin conflicto.1

El análisis de co-citación, propuesto por Henry Small en 1973, ofrece una salida estructural a este problema. La intuición central es elegante: si dos papers son citados juntos por un tercero, comparten algún componente intelectual; si son citados juntos repetidamente por muchos terceros, ese componente es relevante para el campo.2

2. Qué es exactamente la co-citación

2.1. Definiciones de Small (1973) y Marshakova (1973)

En el mismo año dos autoras independientes propusieron la idea · Small en Estados Unidos y Marshakova en la entonces Unión Soviética. Definición formal: la fuerza de co-citación entre dos documentos A y B es el número de documentos posteriores que citan a A y a B simultáneamente.3

Notar el detalle · co-citación no es lo mismo que citación directa. Dos papers pueden no citarse mutuamente y sin embargo tener fuerza de co-citación alta. Esto es importante para detectar bridges intelectuales: papers que conectan dos subcampos sin reconocerlo explícitamente.

2.2. Bibliographic coupling vs co-citation

Hay dos formas relacionadas de mapear redes de citación. Bibliographic coupling (Kessler, 1963) mide papers que citan los mismos documentos · es relación entre artículos contemporáneos. Co-citation mide papers que son citados juntos · es relación entre artículos clásicos a los ojos de la literatura más reciente.4

Implicación práctica: bibliographic coupling es mejor para mapear el frente actual de investigación; co-citation es mejor para identificar la base intelectual del campo.

3. VOSviewer y CiteSpace

3.1. VOSviewer (van Eck & Waltman, 2010)

Herramienta gratuita de la Universidad de Leiden. Importa archivos de Web of Science, Scopus, Dimensions, OpenAlex, Lens, PubMed. Genera mapas con clustering modular y layout VOS (Visualization of Similarities) · clústeres por colores, fuerza de relación por proximidad, tamaño de nodos por número de citaciones.5

Workflow típico: descargar 1,000–10,000 referencias del campo desde Scopus, importar a VOSviewer, generar mapa de co-citación con umbral mínimo 20 citaciones por documento, identificar clústeres principales y leer los nodos centrales.

3.2. CiteSpace (Chen, 2006)

Herramienta gratuita orientada a análisis de evolución temporal. Permite burst detection · identificación de papers cuyas citaciones crecen rápido en una ventana corta de tiempo. Esto es indicador temprano de "frentes emergentes" · subcampos donde está pasando algo.6

CiteSpace agrega también clusterización automática con etiquetas tomadas del título de los papers que citan al clúster · ayuda a nombrar lo que de otro modo es un grupo abstracto de documentos.

4. Cómo identificar trabajos seminales en tu campo

Una vez generado el mapa, los trabajos seminales se identifican con tres métricas complementarias:7

Grado (degree). Número de papers con los que el documento tiene fuerza de co-citación significativa. Grado alto = el paper aparece junto a muchos otros. Estos suelen ser textos canónicos del campo.

Centralidad de intermediación (betweenness). Mide cuántos caminos cortos entre dos nodos cualquiera pasan por este nodo. Betweenness alto = el paper es un puente intelectual entre subcampos. Estos son los textos que conectan tradiciones · perderlos es perder coherencia.

Burstness. Detecta papers con tasas de citación que aumentan abruptamente. Burstness reciente = trabajo seminal del frente emergente. Burstness antiguo = trabajo que tuvo su momento histórico definitorio.

5. Frentes emergentes · cómo detectar dónde está la novedad

Un "research front" (frente de investigación) es un clúster de papers cuyas citaciones crecen rápido en una ventana de 2–5 años. Detectarlos requiere análisis longitudinal · hacer mapas de co-citación de ventanas temporales sucesivas y comparar.8

Indicadores prácticos: aparición reciente del clúster (no estaba hace 5 años), crecimiento rápido del número de nodos, burstness en sus papers centrales, y presencia creciente en literatura gris (preprints arXiv, bioRxiv, SocArXiv).

6. Workflow operativo y caso aplicado

Workflow recomendado para un investigador entrando a un campo nuevo:9 (1) descargar 5,000 referencias representativas del campo desde Scopus o Web of Science, (2) generar mapa de co-citación en VOSviewer con umbral 20 citaciones, (3) identificar 5–10 clústeres principales, (4) seleccionar los 3 nodos centrales por clúster (alto grado, alta betweenness), (5) leer esos 15–30 papers como base, (6) usar CiteSpace para detectar burstness y entrar a los frentes emergentes después.

SamSam automatiza los pasos 1–4 y entrega los nodos centrales por clúster como punto de partida lectora · pero el paso 5 (leer los papers) sigue siendo del investigador.

«Si dos papers son citados juntos por muchos terceros, comparten paisaje intelectual. Mapear ese paisaje es no perderse en literatura ajena.»
  1. Eco, U. (2015). How to Write a Thesis. MIT Press.
  2. Small, H. (1973). Co-citation in the scientific literature: A new measure of the relationship between two documents. Journal of the American Society for Information Science, 24(4), 265–269.
  3. Marshakova, I. V. (1973). System of document connections based on references. Nauchno-Tekhnicheskaya Informatsiya, Series 2, 6(2), 3–8.
  4. Kessler, M. M. (1963). Bibliographic coupling between scientific papers. American Documentation, 14(1), 10–25.
  5. van Eck, N. J., & Waltman, L. (2010). Software survey: VOSviewer, a computer program for bibliometric mapping. Scientometrics, 84(2), 523–538.
  6. Chen, C. (2006). CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of the American Society for Information Science and Technology, 57(3), 359–377.
  7. Newman, M. E. J. (2010). Networks: An Introduction. Oxford University Press.
  8. Kleinberg, J. (2003). Bursty and hierarchical structure in streams. Data Mining and Knowledge Discovery, 7(4), 373–397.
  9. Aria, M., & Cuccurullo, C. (2017). bibliometrix: An R-tool for comprehensive science mapping analysis. Journal of Informetrics, 11(4), 959–975.
  10. Boyack, K. W., & Klavans, R. (2010). Co-citation analysis, bibliographic coupling, and direct citation: Which citation approach represents the research front most accurately? Journal of the American Society for Information Science and Technology, 61(12), 2389–2404.

¿Cómo le explicas a la vida en una frase que tienes una apreciación diferente a las cosas, que las ves de otra manera? ¿Cómo le explicas en una frase que disfrutas las cosas mucho con intensidad, de una manera diferente a la mayoría de las personas? ¿Cómo explicas que, sin ser especial, la vida te hace sentir así? Hay personas que ven la vida, yo la siento.

— Tolo Rullán

SamSam 🦉 Powered by SamSam
// English version below ↓

Co-citation networks · which papers to read in your field without getting lost

When two papers are systematically cited together by a third, there is an intellectual relation between them · even if their authors never read each other. That intuition founded co-citation analysis in 1973 and is today the most powerful tool for not getting lost in unfamiliar literature.

Co-citation analysis (Small, 1973) offers a method to identify the seminal works of a field without having read all of it. If two papers are repeatedly cited together, they share intellectual landscape.

Three operational applications:

  • Bibliometric maps: VOSviewer and CiteSpace turn thousands of papers into navigable visualizations · thematic clusters and central authors.
  • Seminal works: high-degree and high-betweenness nodes reveal the few papers the entire conversation cites.
  • Emerging fronts: burst detection (Kleinberg) identifies clusters with rapidly growing citations · early signal of a hot topic.

The paper closes with a cross-link to the case of evidence-based aesthetic surgery · same methodology applied to a field where separating evidence from marketing is a patient decision.

1. The problem of an unfamiliar literature

Anyone entering a new field faces a hard asymmetry · members of the field know the five to ten papers the entire conversation takes for granted, while the newcomer ignores them. Starting by reading the most cited works on Google Scholar sometimes works, but often leads to old papers without context or to textbooks that repeat orthodoxy without conflict.1

Co-citation analysis, proposed by Henry Small in 1973, offers a structural way out. The core intuition is elegant: if two papers are cited together by a third, they share some intellectual component; if they are repeatedly cited together by many third parties, that component is relevant to the field.2

2. What co-citation actually is

2.1. Definitions by Small (1973) and Marshakova (1973)

In the same year two authors independently proposed the idea · Small in the United States and Marshakova in the then Soviet Union. Formal definition: the co-citation strength between two documents A and B is the number of later documents that cite A and B simultaneously.3

Note the detail · co-citation is not the same as direct citation. Two papers can fail to cite each other and yet have high co-citation strength. This matters for detecting intellectual bridges: papers that connect two subfields without explicitly recognizing it.

2.2. Bibliographic coupling vs co-citation

There are two related ways to map citation networks. Bibliographic coupling (Kessler, 1963) measures papers that cite the same documents · it is a relation between contemporary articles. Co-citation measures papers that are cited together · it is a relation between classic articles in the eyes of more recent literature.4

Practical implication: bibliographic coupling is better for mapping the current research front; co-citation is better for identifying the intellectual base of the field.

3. VOSviewer and CiteSpace

3.1. VOSviewer (van Eck & Waltman, 2010)

Free tool from Leiden University. Imports files from Web of Science, Scopus, Dimensions, OpenAlex, Lens, PubMed. Generates maps with modular clustering and VOS layout (Visualization of Similarities) · clusters by color, relation strength by proximity, node size by number of citations.5

Typical workflow: download 1,000–10,000 references for the field from Scopus, import into VOSviewer, generate co-citation map with a minimum threshold of 20 citations per document, identify main clusters and read the central nodes.

3.2. CiteSpace (Chen, 2006)

Free tool oriented to temporal evolution analysis. Enables burst detection · identification of papers whose citations grow fast in a short time window. This is an early indicator of "emerging fronts" · subfields where something is happening.6

CiteSpace also adds automatic clustering with labels drawn from the titles of papers citing the cluster · helps name what would otherwise be an abstract group of documents.

4. How to identify seminal works in your field

Once the map is generated, seminal works are identified through three complementary metrics:7

Degree. Number of papers with which the document has significant co-citation strength. High degree = the paper appears next to many others. These tend to be canonical texts in the field.

Betweenness centrality. Measures how many short paths between any two nodes pass through this node. High betweenness = the paper is an intellectual bridge between subfields. These are the texts that connect traditions · missing them is missing coherence.

Burstness. Detects papers with citation rates that suddenly rise. Recent burstness = seminal work of an emerging front. Old burstness = work that had its defining historical moment.

5. Emerging fronts · how to detect where the novelty is

A "research front" is a cluster of papers whose citations grow fast in a window of 2–5 years. Detecting them requires longitudinal analysis · making co-citation maps of successive temporal windows and comparing.8

Practical indicators: recent emergence of the cluster (it was not there 5 years ago), fast growth in number of nodes, burstness in its central papers, and increasing presence in grey literature (arXiv, bioRxiv, SocArXiv preprints).

6. Operational workflow and applied case

Recommended workflow for a researcher entering a new field:9 (1) download 5,000 representative references from Scopus or Web of Science, (2) generate a co-citation map in VOSviewer with a 20-citation threshold, (3) identify 5–10 main clusters, (4) select the 3 central nodes per cluster (high degree, high betweenness), (5) read those 15–30 papers as a base, (6) use CiteSpace to detect burstness and enter emerging fronts later.

SamSam automates steps 1–4 and delivers the central nodes per cluster as a reading starting point · but step 5 (reading the papers) remains the researcher's job.

«If two papers are cited together by many third parties, they share intellectual landscape. Mapping that landscape is how you avoid getting lost in unfamiliar literature.»
  1. Eco, U. (2015). How to Write a Thesis. MIT Press.
  2. Small, H. (1973). Co-citation in the scientific literature: A new measure of the relationship between two documents. Journal of the American Society for Information Science, 24(4), 265–269.
  3. Marshakova, I. V. (1973). System of document connections based on references. Nauchno-Tekhnicheskaya Informatsiya, Series 2, 6(2), 3–8.
  4. Kessler, M. M. (1963). Bibliographic coupling between scientific papers. American Documentation, 14(1), 10–25.
  5. van Eck, N. J., & Waltman, L. (2010). Software survey: VOSviewer, a computer program for bibliometric mapping. Scientometrics, 84(2), 523–538.
  6. Chen, C. (2006). CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of the American Society for Information Science and Technology, 57(3), 359–377.
  7. Newman, M. E. J. (2010). Networks: An Introduction. Oxford University Press.
  8. Kleinberg, J. (2003). Bursty and hierarchical structure in streams. Data Mining and Knowledge Discovery, 7(4), 373–397.
  9. Aria, M., & Cuccurullo, C. (2017). bibliometrix: An R-tool for comprehensive science mapping analysis. Journal of Informetrics, 11(4), 959–975.
  10. Boyack, K. W., & Klavans, R. (2010). Co-citation analysis, bibliographic coupling, and direct citation: Which citation approach represents the research front most accurately? Journal of the American Society for Information Science and Technology, 61(12), 2389–2404.

How do you explain to life in one sentence that you have a different appreciation of things, that you see them another way? How do you explain in one sentence that you enjoy things with intensity, in a way different from most people? How do you explain that, without being special, life makes you feel that way? Some people see life. I feel it.

— Tolo Rullán

SamSam 🦉 Powered by SamSam
← Todos los artículos · All articles