Quand tu tapes « gérer son argent » dans Google, tu obtiens des résultats qui parlent aussi de « budget », d'« épargne » et de « finances personnelles » — même si ces mots exacts ne sont pas dans ta requête. C'est de la recherche sémantique. La même technologie, appliquée à ta bibliothèque vidéo personnelle, change radicalement la façon de retrouver du contenu.
La recherche classique et ses limites
La recherche par mots-clés fonctionne sur un principe simple : elle cherche des documents qui contiennent les mots exacts de ta requête. Si tu cherches « recette courgette », elle retourne les textes qui contiennent littéralement ces deux mots.
Le problème : le langage est riche. Un document peut parler de la même chose sans utiliser les mêmes mots. Une recette qui parle de « zucchini » (terme anglais), de « poêlée de légumes verts » ou de « légumes d'été » ne remontera pas dans une recherche par mots-clés sur « courgette ».
Pour une bibliothèque personnelle, cette limite est particulièrement frustrante : tu te souviens du sujet d'une vidéo mais pas des mots exacts utilisés par le créateur. La recherche classique échoue précisément dans ce cas.
Ce que fait la recherche sémantique différemment
La recherche sémantique ne cherche pas des mots — elle cherche du sens. Elle transforme chaque texte (et chaque requête) en un vecteur numérique : un point dans un espace à plusieurs centaines de dimensions où les concepts proches sont géographiquement proches.
Dans cet espace, « gérer son argent », « budget personnel », « épargne mensuelle » et « finances » sont des points très proches les uns des autres. Une recherche sur « gérer son argent » retourne donc les documents dont le sens est proche de cette requête — pas seulement ceux qui contiennent ces mots exacts.
C'est ce qu'on appelle la similarité cosinus : la mesure de l'angle entre deux vecteurs dans cet espace. Plus l'angle est petit (plus les vecteurs pointent dans la même direction), plus les deux textes sont sémantiquement proches.
Les embeddings : comment les mots deviennent des vecteurs
La conversion d'un texte en vecteur s'appelle un embedding. Les modèles d'embedding (text-embedding-3-large d'OpenAI, par exemple) sont des réseaux de neurones entraînés sur des milliards de textes pour apprendre quels concepts sont sémantiquement reliés.
Un embedding typique est un vecteur de 1536 ou 3072 dimensions. Chaque dimension capture une caractéristique sémantique abstraite — pas directement interprétable par un humain, mais qui encode des relations de sens très fines.
Foldeo génère un embedding pour chaque vidéo transcrite et les stocke dans une base de données vectorielle (pgvector, une extension PostgreSQL). Quand tu fais une recherche, ta requête est transformée en embedding, et la base retourne les vidéos dont l'embedding est le plus proche.
En pratique : ce que ça change pour retrouver une vidéo
Exemple concret : tu as sauvegardé une vidéo TikTok où un coach parle de « s'endormir plus facilement » en utilisant la méthode 4-7-8. Tu cherches « sommeil » dans Foldeo. La recherche sémantique retourne cette vidéo même si le mot « sommeil » n'apparaît pas dans la transcription.
Autre exemple : une vidéo sur « l'effet de composition des intérêts » ressort quand tu cherches « faire fructifier son épargne » — parce que les deux concepts sont sémantiquement proches, même s'ils utilisent un vocabulaire différent.
La recherche fonctionne aussi pour des requêtes en langue naturelle : « comment ne pas reprocrastiner le matin » retourne des vidéos sur la routine matinale, la productivité et la gestion du temps — pas besoin d'utiliser le bon mot-clé.
La différence avec une recherche Google
Google utilise aussi la recherche sémantique depuis plusieurs années (via BERT et MUM). La différence avec Foldeo : Google cherche dans des milliards de pages web publiques, Foldeo cherche dans ta bibliothèque privée de vidéos transcrites.
Le contexte personnel change tout. Foldeo sait exactement quels contenus tu as sauvegardés, quels mots sont utilisés dans chaque transcription, et peut donc établir des correspondances sémantiques très précises dans ce corpus restreint.
C'est aussi pour ça que la fonctionnalité Ask fonctionne bien : l'IA a accès à l'intégralité des transcriptions de ta bibliothèque, pas juste aux titres ou aux résumés. Elle peut répondre à des questions précises sur le contenu exact de chaque vidéo.
Recherche sémantique vs recherche par mots-clés : quand utiliser quoi
La recherche sémantique n'est pas toujours supérieure. Pour trouver une vidéo dont tu te souviens d'une phrase exacte (« règle des 4% »), la recherche par mots-clés est plus précise — elle retourne le document qui contient exactement cette phrase, sans bruit.
Foldeo propose les deux modes : recherche par mots-clés pour les requêtes exactes, recherche sémantique pour les requêtes par concept. Dans la plupart des cas, la recherche sémantique donne les meilleurs résultats parce qu'on se souvient rarement des mots exacts d'une vidéo.
La combinaison des deux — hybrid search — est l'état de l'art actuel : on exécute les deux requêtes en parallèle et on fusionne les résultats. C'est ce que font les moteurs de recherche les plus performants, et la direction vers laquelle les outils PKM avancés se dirigent.