🧠

Karpathy LLM Wiki

Méthode complète — Base de connaissance personnelle maintenue par un LLM

Avril 2026 Andrej Karpathy 5 000 étoiles en 4 jours

À propos

Documentation complète du pattern publié par Andrej Karpathy (ex-OpenAI, ex-Tesla AI) en avril 2026. Son gist a atteint 5 000 étoiles en 4 jours et environ 3 000 forks — signe d'une résonance immédiate dans la communauté.

« Obsidian est l'IDE. Le LLM est le programmeur. Le wiki est le codebase. »

— Andrej Karpathy

Le problème résolu

La partie fastidieuse d'une base de connaissance n'est pas la lecture ni la réflexion — c'est la comptabilité : maintenir les références croisées, mettre à jour les résumés, noter les contradictions entre sources. C'est précisément ce que les humains abandonnent, et ce que les LLMs font très bien.

Le LLM Wiki délègue entièrement cette maintenance au LLM. L'humain se concentre sur ce qu'il fait mieux : la curation et l'analyse.

1Shift conceptuel : RAG → Compilation

RAG classique	LLM Wiki
Index vectoriel + embeddings	Fichiers markdown plats
Infrastructure complexe	Aucune infrastructure
« Trouve le document qui contient la réponse »	« La réponse est déjà compilée dans le wiki »
Retrieval probabiliste	Lecture directe de la synthèse
Coûteux à l'usage	~95 % moins cher

2Architecture en trois couches

Sources brutes — raw/

Documents immuables : articles, PDFs, images, transcripts, notes. Jamais modifiés après dépôt. Servent de source de vérité unique et permanente.

Le Wiki — wiki/

Fichiers markdown générés et maintenus par le LLM : résumés, pages d'entités, pages de concepts, synthèses interconnectées. Le LLM maintient cette couche entièrement — l'humain ne l'édite pas directement.

Le Schéma — CLAUDE.md

Document de configuration spécifiant la structure du wiki, les conventions de nommage et les workflows. Guide le comportement du LLM comme un mainteneur discipliné.

Fichiers spéciaux

wiki/index.md

Catalogue orienté contenu listant chaque page wiki avec un résumé d'une ligne, organisé par catégorie. Le LLM le lit en premier lors de chaque requête pour identifier les pages pertinentes. Mis à jour automatiquement à chaque ingestion.

wiki/log.md

Journal chronologique append-only avec formatage de préfixe cohérent. Permet le suivi temporel des ingestions et un parsing simple par script.

Structure de dossiers recommandée

vault/
├── raw/
│   ├── pro/          ← sources brutes professionnelles
│   ├── perso/        ← sources brutes personnelles
│   └── assets/       ← images et pièces jointes
├── wiki/
│   ├── index.md      ← catalogue de toutes les pages
│   ├── log.md        ← journal append-only des ingestions
│   ├── pro/          ← pages wiki synthétisées (pro)
│   └── perso/        ← pages wiki synthétisées (perso)
└── CLAUDE.md         ← schéma et instructions pour le LLM

Karpathy insiste : la structure doit être adaptée à son domaine et ses préférences. C'est un pattern, pas un template rigide.

3Les trois workflows

Ingest — Ingestion d'une source

Ajouter une nouvelle source au vault

Déposer le document dans raw/
Le LLM lit et analyse le document
Crée une page résumé dans wiki/
Met à jour wiki/index.md
Révise les pages d'entités et de concepts connexes existants
Ajoute une entrée dans wiki/log.md

Point clé

Une seule source touche typiquement 10 à 15 pages wiki, composant la connaissance plutôt que de repartir de zéro à chaque fois.

Query — Requête

Interroger la base de connaissance

L'utilisateur pose une question en langage naturel
Le LLM lit wiki/index.md pour identifier les pages pertinentes
Lit ces pages directement
Synthétise une réponse avec citations des sources
Peut générer des outputs multiples : tableaux, slides, résumés exécutifs
Archive les nouvelles synthèses précieuses dans le wiki

Lint — Contrôle qualité

Maintenance périodique de la cohérence

Contradictions entre pages (sources qui se contredisent)
Affirmations dépassées par des sources plus récentes
Pages orphelines sans liens entrants
Pages de concepts manquantes à créer
Références croisées cassées ou obsolètes
Lacunes de données à investiguer et combler

4Outils recommandés

Obsidian comme IDE

Web Clipper — convertit les articles web en markdown directement dans raw/
Graph view — visualise la connectivité et les lacunes du wiki
Plugin Marp — génère des slides depuis le markdown en un prompt
Plugin Dataview — requête les métadonnées du frontmatter YAML
Attachment folder — configurer sur raw/assets/ pour les images locales

Outils optionnels

qmd — recherche locale hybride BM25/vectorielle avec re-ranking LLM
Scripts shell pour parser et analyser les fichiers log.md

5Domaines d'application

👤 Personnel Développement personnel, journaux + articles, suivi d'objectifs

🔬 Recherche Plongées approfondies avec thèses évolutives, veille académique

📚 Lecture Wikis compagnons de livres (personnages, thèmes, citations)

🏢 Business Wikis internes alimentés par Slack, transcripts, appels clients

🔍 Analyse Concurrentielle, due diligence, planification de voyage

🎓 Formation Notes de cours enrichies, synthèses de MOOCs

6Philosophie

Le modèle est intentionnellement abstrait. Karpathy décrit des patterns plutôt que des implémentations spécifiques :

« Tout ce qui est mentionné ci-dessus est optionnel et modulaire — prenez ce qui est utile, ignorez le reste. »

— Andrej Karpathy

Il fait un parallèle avec le concept Memex de Vannevar Bush (1945) — un système de connaissance personnelle curé avec des associations significatives entre documents — mais résout le problème de maintenance grâce à l'automatisation par LLM. Ce que Bush imaginait comme futur en 1945 est devenu trivial en 2026.