Vocal natif
Wake word « Jarvis » détecté localement via OpenWakeWord. Transcription Faster-Whisper — précision native français, aucune donnée transmise.
pour le codeSystème d'assistance vocal personnel
L'intelligence artificielle locale. Aucun cloud. Aucune limite.
SYSTÈME EN LIGNE| RTX 4070 SUPER| 100% LOCAL| ~2s LATENCE
Tout tourne sur votre machine — rien ne sort de votre réseau.
Wake word « Jarvis » détecté localement via OpenWakeWord. Transcription Faster-Whisper — précision native français, aucune donnée transmise.
pour le code# détection wake word locale, 0 latence réseau from openwakeword import Model model = Model(wakeword_models=["jarvis"]) while listening: chunk = mic.read(1280) score = model.predict(chunk)["jarvis"] if score > 0.5: stt.transcribe(buffer, lang="fr")
57 intents reconnus par regex en ~10ms — sans LLM. Ouvrir Chrome sur l'écran 2, jouer Spotify, entourer un élément, générer une image… tout s'exécute en local instantanément.
pour le code# un parmi 57 — match en O(1), zero LLM INTENT_OPEN_APP = re.compile( r"^(ouvre|lance)\s+(?P<app>[\w ]+?)" r"(?:\s+(?:sur|en)\s+(?P<loc>.+))?$", re.IGNORECASE ) if m := INTENT_OPEN_APP.match(text): dispatch(OPEN_APP, m.groupdict())
Qwen 2.5 14B pour la conversation, DeepSeek R1 14B pour le raisonnement complexe. Sélection automatique par complexité et VRAM disponible — 3B à 32B selon votre GPU.
pour le code# sélection en ~5ms selon complexité + VRAM def select_model(complexity, vram_gb): if complexity == "REASONING": return "deepseek-r1:14b" if vram_gb >= 24: return "qwen2.5:32b" if vram_gb >= 12: return "qwen2.5:14b" if vram_gb >= 8: return "qwen2.5:7b" return "qwen2.5:3b"
Aucun token ne quitte votre réseau. Mode confidentiel désactive les fallbacks cloud. Whisper, Ollama, Edge-TTS, LLaVA — tout tourne sur votre machine.
pour le code# aucune sortie réseau. point. PRIVACY_MODE = True CLOUD_FALLBACKS = [] # désactivés assert all(m.is_local for m in models) assert outbound_bytes_since_boot == 0 # vous pouvez couper internet — ça marche
Faits permanents persistants entre sessions. Semi-auto : Jarvis détecte vos déclarations mémorisables et demande confirmation. La mémoire fait autorité sur les connaissances du modèle.
pour le code# fait local, embedding local, persistance JSON def memorize(fact: str): facts.append(fact) emb = encoder.encode(fact) index.add(np.array([emb])) save_json("memory.json", facts) def recall(query): return facts[index.search(query, k=3)]
OCR Tesseract + UIA + LLaVA 7B local. « Entoure le bouton OK » fonctionne réellement : pipeline 5 couches qui trouve et encadre n'importe quel élément visible à l'écran.
pour le code# fallback en cascade jusqu'à trouver la cible def find(query): return ( Win32Finder().find(query) or UIAFinder().find(query) or OCRFinder().find(query) or LLaVAFinder().find(query) or BannerFallback(query) ) draw_frame(find("bouton OK").rect)
Démo textuelle — aperçu limité de l'assistant
Limite atteinte. Installez Jarvis pour l'expérience complète.
De votre voix à la réponse audio — chaque étape tourne en local.
Détectées en ~10ms par regex — sans LLM, sans latence
Un assistant avec une personnalité — et des lois non négociables.
* La détection VRAM est automatique au démarrage. Aucune configuration manuelle.