Direkte Antwort
Ja — eine spezialisierte KI übersetzt Supplement-Studien sehr gut, indem sie die Methodik (RCT vs. Beobachtung vs. Tier), Stichprobengröße, Studiendauer und konkrete Effektgrößen aus den PubMed-Originalen extrahiert und in verständliche Form bringt. Wichtig: das funktioniert nur mit Tools, die echten Live-Zugriff auf PubMed haben (z.B. Biohacking AI). Generische KI-Chats (ChatGPT, Claude, Gemini) halluzinieren bei spezifischen Studien-Anfragen regelmäßig nicht-existierende PMIDs.
Was eine gute Studien-Erklärung leistet
Sie übersetzt Methodik
Statt nur „eine Studie zeigt X" zu sagen, ordnet eine gute KI die Methodik ein: Meta-Analyse (am stärksten — fasst viele Studien zusammen), RCT (Goldstandard der Einzelstudie), Kohortenstudie (zeigt Assoziation, nicht Kausalität), Fallserie (deskriptiv), Tierstudie (biologisch plausibel, nicht human).
Beispiel: „Studien zu Ashwagandha sind primär RCTs mit kleinen Stichproben (n=30-80), kurzer Dauer (4-8 Wochen), gemischtem Conflict-of-Interest. Eine Cochrane-Meta-Analyse fehlt aktuell."
Sie nennt konkrete Effektgrößen
Statt „verbessert Schlaf signifikant" → „verbessert Schlafqualität (PSQI-Score) um -1.5 Punkte bei n=58 älteren Erwachsenen mit Insomnie, Effektstärke moderat (d=0.4)". Konkrete Zahlen, kein Marketing-Speak.
Sie zeigt Lücken explizit
„Daten zu Lion's Mane bei jungen Erwachsenen mit normaler Kognition sind dünn — die meisten Studien fokussieren auf milde kognitive Beeinträchtigung bei Älteren." Statt zu erfinden, wo nichts ist.
Sie verlinkt zur Primärquelle
Klickbare PubMed-Links zu jeder zitierten Studie, damit du selbst nachlesen kannst. „Vertrauen, aber verifizieren" — das funktioniert nur bei zitierten Quellen.
Wo generische KI versagt
Halluzinations-Risiko: Du fragst ChatGPT: „Welche Studie zeigt Wirkung von NMN auf NAD+-Spiegel im Menschen?" → ChatGPT antwortet mit „Smith et al. 2022, PMID 35XXXXXX zeigt 38 % NAD+-Anstieg" — und du findest weder Smith 2022 noch die PMID auf PubMed. Erfunden. Bei Health-Themen wiederholtes, dokumentiertes Problem.
Veraltetes Training-Wissen: Trainingsdaten haben Cutoffs (oft 1-2 Jahre alt). Neuere Studien fehlen. Bei sich schnell entwickelnden Themen (z.B. GLP-1, Peptide) sind Live-Datenbanken nötig.
Kein Methodik-Ranking: generische KI behandelt eine kleine Pilotstudie oft wie eine große Meta-Analyse. Differenzierung der Evidenzstufe fehlt oft.
Wie Biohacking AI das macht
Beispiel-Anfrage: „Wie gut ist Magnesium-Bisglycinat bei Schlafproblemen belegt?"
- Live-PubMed-Recherche zu „magnesium bisglycinate sleep" und verwandten Begriffen
- Aggregation: Abbasi 2012 (PMID 23853635) als stärkste Studie identifiziert
- Übersetzung: „RCT, n=46, ältere Erwachsene mit primärer Insomnie, 500 mg Magnesium/Tag, 8 Wochen. PSQI-Verbesserung um -1.5 Punkte, Einschlafzeit -17 Min, Effekt moderat."
- Evidenzstufe: B+ (RCT, moderate Stichprobe, replikationsbedürftig)
- Caveat: „Probanden waren älter und mit dokumentierter Insomnie. Übertragbarkeit auf jüngere Erwachsene ohne Schlafstörung unklar."
- Klickbarer Link zur Studie auf PubMed.
Alles in 5-10 Sekunden, ohne Halluzination.
Methodik — Was wir bei der Übersetzung prüfen
Vier Punkte pro Studie: a) Studientyp (RCT > Beobachtung > Tier), b) Stichprobengröße + Dauer, c) Effektgröße in Zahlen (nicht nur p-Wert), d) Conflict-of-Interest. Eine Studie wird klar als „starkes Signal", „vorläufiger Hinweis" oder „nicht überzeugend" eingeordnet — nicht als generisches „Studien zeigen…".
Quellen
- Abbasi B et al. 2012 — Magnesium supplementation on primary insomnia PMID 23853635
- Spotnitz M et al. 2024 — LLM hallucinations in medical contexts PMID 38477964
- PubMed — 35M+ biomedizinische Studien