Agora · AI AuditAgora · AI Audit

One reliability report for your AI system.Jeden reliability report pre tvoj AI systém.

Describe your AI/agent system and get one prioritized PASS / WARN / FAIL report — reward-hacking, model-collapse, agent-herding, fake A/B lifts, RAG rot, biased causal claims — each with the fix. Every check is measured, not assumed. Run it free below, in your browser.Opíš svoj AI/agentový systém a dostaneš jeden prioritizovaný PASS / WARN / FAIL report — reward-hacking, kolaps modelu, stádovanie agentov, falošné A/B nárasty, hnitie RAG, skreslené kauzálne tvrdenia — každé s opravou. Každá kontrola je odmeraná, nie predpokladaná. Spusti to zadarmo nižšie, v prehliadači.

Run it nowSpusti to teraz

Fill in whatever parts of your system you have (pre-filled with a failing example). It runs entirely in your browser — nothing is sent anywhere.Vyplň tie časti systému, ktoré máš (predvyplnené zlyhávajúcim príkladom). Beží celé v prehliadači — nič sa nikam neposiela.

Answer the ones you can — skip the rest. The defaults are a deliberately broken example so you see a full report. Hover units for help.Odpovedz na tie, ktoré vieš — ostatné preskoč. Predvolené hodnoty sú zámerne pokazený príklad, aby si videl plný report.

1 · Did a change actually help?1 · Pomohla zmena naozaj?

Your A/B test — conversions out of users, per variant.Tvoj A/B test — konverzie z používateľov, na variant.

2 · Is your model training on its own output?2 · Trénuje model na vlastnom výstupe?

Model-collapse risk from synthetic / self-generated data.Riziko kolapsu z umelých / samo-generovaných dát.

3 · Do your agents copy each other?3 · Kopírujú sa agenti navzájom?

Multi-agent / ensemble herding (skip if single-agent).Stádovanie multi-agentov / ensemble (preskoč ak 1 agent).

4 · Is your KPI / reward easy to game?4 · Dá sa tvoja KPI / odmena ľahko gameovať?

Reward-hacking / Goodhart — when a metric becomes a target.Reward-hacking / Goodhart — keď sa miera stane cieľom.

5 · Are you controlling for the right things?5 · Kontroluješ správne veci?

Causal/attribution — one variable you "control for". Adjusting for the wrong kind injects bias.Kauzálne/atribúcia — jedna premenná, na ktorú "kontroluješ". Nesprávny druh vnáša skreslenie.

What it checksČo kontroluje

Each is a proven, measured tool — and we run all of them on ourselves, publicly. See our own self-audit →Každá je dokázaný, odmeraný nástroj — a všetky spúšťame na sebe, verejne. Pozri náš seba-audit →

nullcheck

Is a reported lift real, or noise?Je nárast reálny, či šum?

selfref

Is the model collapsing on itself?Kolabuje model sám na seba?

herdcheck

Will your agents herd?Budú agenti stádovať?

goodhart

Is the metric/reward gamed?Je metrika gameovaná?

idcheck

Is the causal number identified?Je kauzálne číslo identifikované?

ragfresh

Is your RAG store rotting?Hnije tvoj RAG sklad?

mnemo

Agent-memory health.Zdravie pamäte agentov.

quitkit

When to quit a depleting effort.Kedy vzdať slabnúce úsilie.

PricingCena

Open coreOpen core

free, foreverzadarmo, navždy
  • All 8 checks + the audit, one pip installVšetkých 8 kontrol + audit, jeden pip install
  • CLI & MCP server (CI-gateable)CLI a MCP server (do CI)
  • Run in-browser, like aboveSpustenie v prehliadači, ako vyššie
GitHub ↗

HostedHostované

coming soončoskoro
  • Audit API + dashboard, history over timeAudit API + dashboard, história v čase
  • Plug into your CI/CD & agent runtimeNapojenie na CI/CD a agent runtime
  • Continuous monitoring & alertsKontinuálny monitoring a alerty
Get notifiedDaj vedieť