AI Audit — one reliability report for your AI system

Run it nowSpusti to teraz

Fill in whatever parts of your system you have (pre-filled with a failing example). It runs entirely in your browser — nothing is sent anywhere.Vyplň tie časti systému, ktoré máš (predvyplnené zlyhávajúcim príkladom). Beží celé v prehliadači — nič sa nikam neposiela.

Answer the ones you can — skip the rest. The defaults are a deliberately broken example so you see a full report. Hover units for help.Odpovedz na tie, ktoré vieš — ostatné preskoč. Predvolené hodnoty sú zámerne pokazený príklad, aby si videl plný report.

1 · Did a change actually help?1 · Pomohla zmena naozaj?

Your A/B test — conversions out of users, per variant.Tvoj A/B test — konverzie z používateľov, na variant.

A: conversionskonverzie A: userspoužívatelia B: conversionskonverzie B: userspoužívatelia

2 · Is your model training on its own output?2 · Trénuje model na vlastnom výstupe?

Model-collapse risk from synthetic / self-generated data.Riziko kolapsu z umelých / samo-generovaných dát.

% of training data that is REAL / human% trénovacích dát, čo je REÁLNE / ľudské does it over-trust its own past answers?prehnane verí vlastným minulým odpovediam?

3 · Do your agents copy each other?3 · Kopírujú sa agenti navzájom?

Multi-agent / ensemble herding (skip if single-agent).Stádovanie multi-agentov / ensemble (preskoč ak 1 agent).

how many peers' answers each agent seeskoľko odpovedí peers vidí každý agent how much it weights its OWN evidence (1 = same as a peer)ako váži VLASTNÝ dôkaz (1 = ako peer)

4 · Is your KPI / reward easy to game?4 · Dá sa tvoja KPI / odmena ľahko gameovať?

Reward-hacking / Goodhart — when a metric becomes a target.Reward-hacking / Goodhart — keď sa miera stane cieľom.

how gameable is the metric?aká gameovateľná je metrika? how many independent metrics combined?koľko nezávislých metrík spolu?

5 · Are you controlling for the right things?5 · Kontroluješ správne veci?

Causal/attribution — one variable you "control for". Adjusting for the wrong kind injects bias.Kauzálne/atribúcia — jedna premenná, na ktorú "kontroluješ". Nesprávny druh vnáša skreslenie.

What it checksČo kontroluje

Each is a proven, measured tool — and we run all of them on ourselves, publicly. See our own self-audit →Každá je dokázaný, odmeraný nástroj — a všetky spúšťame na sebe, verejne. Pozri náš seba-audit →

nullcheck

Is a reported lift real, or noise?Je nárast reálny, či šum?

selfref

Is the model collapsing on itself?Kolabuje model sám na seba?

herdcheck

Will your agents herd?Budú agenti stádovať?

goodhart

Is the metric/reward gamed?Je metrika gameovaná?

idcheck

Is the causal number identified?Je kauzálne číslo identifikované?

ragfresh

Is your RAG store rotting?Hnije tvoj RAG sklad?

mnemo

Agent-memory health.Zdravie pamäte agentov.

quitkit

When to quit a depleting effort.Kedy vzdať slabnúce úsilie.

PricingCena

Open coreOpen core

free, foreverzadarmo, navždy

All 8 checks + the audit, one pip installVšetkých 8 kontrol + audit, jeden pip install
CLI & MCP server (CI-gateable)CLI a MCP server (do CI)
Run in-browser, like aboveSpustenie v prehliadači, ako vyššie

GitHub ↗

HostedHostované

coming soončoskoro

Audit API + dashboard, history over timeAudit API + dashboard, história v čase
Plug into your CI/CD & agent runtimeNapojenie na CI/CD a agent runtime
Continuous monitoring & alertsKontinuálny monitoring a alerty

Get notifiedDaj vedieť