Méthode complète — Base de connaissance personnelle maintenue par un LLM
Documentation complète du pattern publié par Andrej Karpathy (ex-OpenAI, ex-Tesla AI) en avril 2026. Son gist a atteint 5 000 étoiles en 4 jours et environ 3 000 forks — signe d'une résonance immédiate dans la communauté.
« Obsidian est l'IDE. Le LLM est le programmeur. Le wiki est le codebase. »
La partie fastidieuse d'une base de connaissance n'est pas la lecture ni la réflexion — c'est la comptabilité : maintenir les références croisées, mettre à jour les résumés, noter les contradictions entre sources. C'est précisément ce que les humains abandonnent, et ce que les LLMs font très bien.
Le LLM Wiki délègue entièrement cette maintenance au LLM. L'humain se concentre sur ce qu'il fait mieux : la curation et l'analyse.
| RAG classique | LLM Wiki |
|---|---|
| Index vectoriel + embeddings | Fichiers markdown plats |
| Infrastructure complexe | Aucune infrastructure |
| « Trouve le document qui contient la réponse » | « La réponse est déjà compilée dans le wiki » |
| Retrieval probabiliste | Lecture directe de la synthèse |
| Coûteux à l'usage | ~95 % moins cher |
raw/wiki/CLAUDE.mdwiki/index.mdCatalogue orienté contenu listant chaque page wiki avec un résumé d'une ligne, organisé par catégorie. Le LLM le lit en premier lors de chaque requête pour identifier les pages pertinentes. Mis à jour automatiquement à chaque ingestion.
wiki/log.mdJournal chronologique append-only avec formatage de préfixe cohérent. Permet le suivi temporel des ingestions et un parsing simple par script.
vault/ ├── raw/ │ ├── pro/ ← sources brutes professionnelles │ ├── perso/ ← sources brutes personnelles │ └── assets/ ← images et pièces jointes ├── wiki/ │ ├── index.md ← catalogue de toutes les pages │ ├── log.md ← journal append-only des ingestions │ ├── pro/ ← pages wiki synthétisées (pro) │ └── perso/ ← pages wiki synthétisées (perso) └── CLAUDE.md ← schéma et instructions pour le LLM
Karpathy insiste : la structure doit être adaptée à son domaine et ses préférences. C'est un pattern, pas un template rigide.
raw/wiki/wiki/index.mdwiki/log.mdUne seule source touche typiquement 10 à 15 pages wiki, composant la connaissance plutôt que de repartir de zéro à chaque fois.
wiki/index.md pour identifier les pages pertinentesraw/raw/assets/ pour les images localesqmd — recherche locale hybride BM25/vectorielle avec re-ranking LLMlog.mdLe modèle est intentionnellement abstrait. Karpathy décrit des patterns plutôt que des implémentations spécifiques :
« Tout ce qui est mentionné ci-dessus est optionnel et modulaire — prenez ce qui est utile, ignorez le reste. »
Il fait un parallèle avec le concept Memex de Vannevar Bush (1945) — un système de connaissance personnelle curé avec des associations significatives entre documents — mais résout le problème de maintenance grâce à l'automatisation par LLM. Ce que Bush imaginait comme futur en 1945 est devenu trivial en 2026.