🧠

Karpathy LLM Wiki

Méthode complète — Base de connaissance personnelle maintenue par un LLM

Avril 2026 Andrej Karpathy 5 000 étoiles en 4 jours
À propos

Documentation complète du pattern publié par Andrej Karpathy (ex-OpenAI, ex-Tesla AI) en avril 2026. Son gist a atteint 5 000 étoiles en 4 jours et environ 3 000 forks — signe d'une résonance immédiate dans la communauté.

« Obsidian est l'IDE. Le LLM est le programmeur. Le wiki est le codebase. »

— Andrej Karpathy
Le problème résolu

La partie fastidieuse d'une base de connaissance n'est pas la lecture ni la réflexion — c'est la comptabilité : maintenir les références croisées, mettre à jour les résumés, noter les contradictions entre sources. C'est précisément ce que les humains abandonnent, et ce que les LLMs font très bien.

Le LLM Wiki délègue entièrement cette maintenance au LLM. L'humain se concentre sur ce qu'il fait mieux : la curation et l'analyse.

1Shift conceptuel : RAG → Compilation

RAG classique LLM Wiki
Index vectoriel + embeddings Fichiers markdown plats
Infrastructure complexe Aucune infrastructure
« Trouve le document qui contient la réponse » « La réponse est déjà compilée dans le wiki »
Retrieval probabiliste Lecture directe de la synthèse
Coûteux à l'usage ~95 % moins cher

2Architecture en trois couches

1
Sources brutes — raw/
Documents immuables : articles, PDFs, images, transcripts, notes. Jamais modifiés après dépôt. Servent de source de vérité unique et permanente.
2
Le Wiki — wiki/
Fichiers markdown générés et maintenus par le LLM : résumés, pages d'entités, pages de concepts, synthèses interconnectées. Le LLM maintient cette couche entièrement — l'humain ne l'édite pas directement.
3
Le Schéma — CLAUDE.md
Document de configuration spécifiant la structure du wiki, les conventions de nommage et les workflows. Guide le comportement du LLM comme un mainteneur discipliné.
Fichiers spéciaux
wiki/index.md

Catalogue orienté contenu listant chaque page wiki avec un résumé d'une ligne, organisé par catégorie. Le LLM le lit en premier lors de chaque requête pour identifier les pages pertinentes. Mis à jour automatiquement à chaque ingestion.

wiki/log.md

Journal chronologique append-only avec formatage de préfixe cohérent. Permet le suivi temporel des ingestions et un parsing simple par script.

Structure de dossiers recommandée
vault/
├── raw/
│   ├── pro/          ← sources brutes professionnelles
│   ├── perso/        ← sources brutes personnelles
│   └── assets/       ← images et pièces jointes
├── wiki/
│   ├── index.md      ← catalogue de toutes les pages
│   ├── log.md        ← journal append-only des ingestions
│   ├── pro/          ← pages wiki synthétisées (pro)
│   └── perso/        ← pages wiki synthétisées (perso)
└── CLAUDE.md         ← schéma et instructions pour le LLM

Karpathy insiste : la structure doit être adaptée à son domaine et ses préférences. C'est un pattern, pas un template rigide.

3Les trois workflows

Ingest — Ingestion d'une source
Ajouter une nouvelle source au vault
  1. Déposer le document dans raw/
  2. Le LLM lit et analyse le document
  3. Crée une page résumé dans wiki/
  4. Met à jour wiki/index.md
  5. Révise les pages d'entités et de concepts connexes existants
  6. Ajoute une entrée dans wiki/log.md
Point clé

Une seule source touche typiquement 10 à 15 pages wiki, composant la connaissance plutôt que de repartir de zéro à chaque fois.

Query — Requête
Interroger la base de connaissance
  1. L'utilisateur pose une question en langage naturel
  2. Le LLM lit wiki/index.md pour identifier les pages pertinentes
  3. Lit ces pages directement
  4. Synthétise une réponse avec citations des sources
  5. Peut générer des outputs multiples : tableaux, slides, résumés exécutifs
  6. Archive les nouvelles synthèses précieuses dans le wiki
Lint — Contrôle qualité
Maintenance périodique de la cohérence
  • Contradictions entre pages (sources qui se contredisent)
  • Affirmations dépassées par des sources plus récentes
  • Pages orphelines sans liens entrants
  • Pages de concepts manquantes à créer
  • Références croisées cassées ou obsolètes
  • Lacunes de données à investiguer et combler

4Outils recommandés

Obsidian comme IDE
Outils optionnels
  • qmd — recherche locale hybride BM25/vectorielle avec re-ranking LLM
  • Scripts shell pour parser et analyser les fichiers log.md

5Domaines d'application

👤 Personnel Développement personnel, journaux + articles, suivi d'objectifs
🔬 Recherche Plongées approfondies avec thèses évolutives, veille académique
📚 Lecture Wikis compagnons de livres (personnages, thèmes, citations)
🏢 Business Wikis internes alimentés par Slack, transcripts, appels clients
🔍 Analyse Concurrentielle, due diligence, planification de voyage
🎓 Formation Notes de cours enrichies, synthèses de MOOCs

6Philosophie

Le modèle est intentionnellement abstrait. Karpathy décrit des patterns plutôt que des implémentations spécifiques :

« Tout ce qui est mentionné ci-dessus est optionnel et modulaire — prenez ce qui est utile, ignorez le reste. »

— Andrej Karpathy

Il fait un parallèle avec le concept Memex de Vannevar Bush (1945) — un système de connaissance personnelle curé avec des associations significatives entre documents — mais résout le problème de maintenance grâce à l'automatisation par LLM. Ce que Bush imaginait comme futur en 1945 est devenu trivial en 2026.