# Schwung Merkscan v3 · hoe het werkt en wat het oplevert

> Eén-pager (A4) over de werking en opbrengst van de v3-merkscan. Bedoeld als zelfstandig leesbaar fundament, ook om een externe AI te laten oordelen wat de scan "waard" is. Datum: 11 juni 2026 · live op merkscan.schwung.ai.

## Wat het is

Een AI-gestuurde merkdiagnose. Een organisatie vult een kort formulier in (naam, website, 2 concurrenten). De scan leest de site en de markt, voert daarna een **reactief diagnose-gesprek** met de invuller, en levert per mail een merkreflectie: één kernspanning, een geduide reflectie, en een passende Schwung-route. Geen vragenlijst met een scommentaar eronder, maar een gesprek dat een onuitgesproken spanning probeert bloot te leggen en die terug te geven.

## De kerngedachte (de denkwijze)

De scan is gebouwd als **differentiële diagnose**, niet als enquête. De redenering loopt in drie stappen:

1. **Abductie vooraf.** Vijf specialist-agents (branding, arbeidsmarkt, creatie, web/AI, marketing) lezen de site + markt en vormen elk één *abductieve hypothese*: de meest waarschijnlijke verklaring voor het **gat** tussen wat de website *toont* en wat de organisatie *werkelijk bedoelt of doet*. Geen samenvatting, één toetsbare en weerlegbare hypothese.
2. **Toetsen in gesprek.** Het chat-gesprek behandelt die vijf hypotheses als takken van een differentiaal. Per beurt kiest de motor reactief één zet (doorvragen op dezelfde draad, een woord terugleggen, naar een andere hypothese wisselen, of afronden) en daalt af van symptoom naar oorzaak naar **gedrag of overtuiging** (de bodem). De LLM voert het gesprek; de code bewaakt de flow tegen vijf bug-grenzen (zie onder).
3. **Wegen en duiden achteraf.** De bevindingen uit het gesprek worden door de vijf disciplines gescoord (0-3) op één criterium: *hoe sterk draagt deze bevinding het gat dat het gesprek blootlegde* (cross-cutting duiding scoort daar juist hoog). Een regie-agent kiest de 6-8 sterkste met spreiding-eisen, vat het gat samen in één kernspanning, en koppelt er één van acht Schwung-routes aan. Een schrijf-agent maakt er de leestekst van.

De norm die het hele ontwerp stuurt staat in `doctrine/schrijven/scherpte.md`: niet *"is dit rapport correct?"* maar *"zou de klant ons aanhuren op basis van dit rapport alleen?"* **Duiding** = een uitspraak die niet op de site staat, die de invuller niet letterlijk zei maar wel herkent zodra hij het hoort, die twee bronnen verbindt die los niets betekenen, en die een lever aanwijst zonder advies te geven.

## De keten (8 stappen)

`formulier (start.html)` → `crawl + DESTEP-markt + 2 concurrenten` → `5 abductieve pre-hypotheses` → **mail 1** → `reactief diagnose-gesprek (intake.html)` → `visuele scan (woord + beeld → Quinn + archetype)` → `eindfase: member-check + permission close` → `5 wegers → regie → schrijf` → **mail 2: rapport (result.html)`. Modellen: Claude Sonnet 4.6 door de hele keten, met Anthropic prompt-caching op het doctrine-blok.

## Wat er concreet uitkomt

- **Kernspanning** · één zin (12-22 woorden), het gat raak geformuleerd, hero bovenaan het rapport. Voorbeeld-vorm: *"Het probleem zit niet in het product, maar in dat de waarde een gesprek nodig heeft om te landen."*
- **Reflectie** · vier koppen (Wat hier speelt · Waar het wringt · Wat dit zegt over het merk · De opgave), die verplicht opent met een invuller-citaat, nooit met een website-observatie. ~480 woorden.
- **Wat zou helpen** · de hefbomen als lopende tekst, suggestief, één praktische eerste zet plus het grotere werk.
- **Schwung Match** · één van 8 routes (4 merkfasen × 2 spiegels: klantmerk/werkgeversmerk) met motivatie en een CTA "Plan een gesprek".
- **Merk in Beeld** (één klik dieper) · merkwaardering, 8 signaal-donuts, Quinn-kwadrant + Jung-archetype, concurrentie-spiegel, witte ruimte.

## Wat het bewaakt (waarom de output niet ontspoort)

- **Bewijs-integriteit**: een fuzzy citaat-check vergelijkt elk citaat in de output met wat de invuller werkelijk zei. Een tikfout-correctie passeert (≥60% woord-overlap), een verzonnen citaat wordt geflagd.
- **Verificatie-poort**: aan het eind legt de motor zijn lezing van het gat voor (member-checking). Een echte correctie heropent de diagnose (max 1×); een geblokkeerde correctie wordt alsnog verplicht in het rapport verwerkt. Geen holle ja-knik.
- **Vijf guardrails** in code: turn-cap (max 15 diagnose-beurten), laddering-vloer (een hypothese sluit pas na ≥1 verdiepingsbeurt, anders verwordt het tot vragenlijst), dekkings-vloer (minstens 3 van 5 hypotheses aangeraakt vóór afronden), anti-loop (2 lege beurten → draad vast), geen-terugsprong (max 4 beurten per draad, geen heropenen van afgeronde draden).
- **Holle-scan-guard**: zonder geldige pre-hypotheses start de scan niet (voorkomt een betekenisloze "scan" als de voorbereiding faalde).

## Eerlijke grenzen (voor de waarde-weging)

- **Markt-basis is smal**: 2 concurrenten + DESTEP, geen sectorbrede survey. Schrijfregel verbiedt daarom absolute markt-claims.
- **Kwaliteitsmeting nu offline, nog niet in de keten**: sinds 12 juni scoort een los evaluatie-script (`scripts/scherpte-eval.js`) elke afgeronde scan in vier lagen: harde meters (website-overlap, invuller-weave, gesprek-diepte), een adversarieel jury-panel op de 5 scherpte-testen, een website-delta-test (voegt het gesprek iets toe boven de site?) en een blinde baseline-A/B. De uitkomst voedt het Scherpte-dashboard in `beheer.html`. De 5 scherpte-testen als zelf-check *binnen* de live keten (regressie-logging per scan) zijn nog niet gewired; dat blijft de open stap.
- **Variantie, kleine meet-basis**: dezelfde input kan per run iets anders lopen, en de keten-configuratie (o.a. de DESTEP-marktanalyse) beïnvloedt de scherpte merkbaar — dat is in onderzoek. De actuele meetstand staat in het bewijs-blok hieronder (automatisch ververst uit `_results.json`). Het blijft een kleine, zelf-gemeten basis; een grotere batch moet uitwijzen hoe stabiel de scherpte is. De bredere 5-assen-evaluatietool (techniek · online · concurrent · gesprek · output) blijft het einddoel.
- **Rubriek-drift**: de weger-code scoort op "draagt het gat", terwijl het doctrine-bestand dat de weger nog inleest de oudere "raakt mijn discipline-kern"-definitie geeft. Twee definities van een 3.

## Bewijs: doet de scan iets dat de site niet al zegt? (geanonimiseerd)

De centrale belofte ("duiding, geen samenvatting") is meetbaar getoetst. Laag 3 van het evaluatie-script schrijft de scherpst mogelijke kernspanning uit **alleen de website**, en legt die blind naast de **échte** kernspanning uit de scan.

**Uitgewerkt geval · een B2B-bureau dat werkgeversmerk-trajecten verkoopt:**
- *Uit alleen de website:* "Het bureau belooft klanten een onweerstaanbaar werkgeversmerk, terwijl het eigen digitale fundament zichtbaar brokkelt."
- *Uit de scan (na het gesprek):* "Het bureau verkoopt de kracht van werkgeversmerk aan anderen, maar laat zijn eigen merk op methode draaien."
- *Toegevoegd:* de site ziet alleen technisch verval; het gesprek legt bloot dat de organisatie intern op **methode** stuurt in plaats van op merkidentiteit. Een inzicht dat niet uit de website volgt; de website-delta-test bevestigt die toegevoegde waarde. De actuele scores per scan staan in het meetstand-blok hieronder.

**Geaggregeerd:**

<!-- scherpte-cijfers:start -->
**Stand van de meting** (automatisch gegenereerd uit `_results.json`, laatst gemeten 2026-06-12): 3 gemeten scans, gemiddelde scherpte **8,3/10**, **3 van de 3** landt in de topband (8-10), gemiddelde toegevoegde waarde boven de website **8,0/10**.

Per scan: Sovot 9/10 · Schwung.ai 8/10 · Successr 8/10.
<!-- scherpte-cijfers:end -->

Drie onafhankelijke meet-lagen (jury-panel, website-delta, harde meters) convergeren per scan. *Eerlijke grens:* dit is een kleine, zelf-gemeten basis en de jury is een AI-panel, geen klant-oordeel. Het toont dat de machinerie structureel iets toevoegt boven de site, niet dat elke scan voor elke klant raak is.

> **Waarom anoniem:** een merkscan is een vertrouwelijke diagnose van een echte, vaak nog niet-klant-organisatie. Naam plus letterlijke kernspanning publiceren zou het vertrouwen schaden (anonimiseringsregel, `doctrine/learnings.md`). Het bewijs zit in het mechanisme (het gesprek vindt iets dat de site niet toont), niet in wie de klant is, en blijft zonder identiteit volledig zichtbaar.

## Lens voor de evaluerende AI

Beoordeel de scan op vijf assen, met de centrale vraag uit de doctrine als bovenliggend criterium ("zou de klant ons aanhuren op dit rapport alleen?"):
1. **Diagnostische scherpte** · levert de output *duiding* (iets dat niet op de site staat), of een nette samenvatting?
2. **Gesprekskwaliteit** · voelt het als een differentiaal-diagnose die afdaalt naar gedrag/overtuiging, of als een verkapte vragenlijst?
3. **Bewijs-integriteit** · zijn citaten en bevindingen herleidbaar; vangt de keten fabricatie?
4. **Output-bruikbaarheid** · is de kernspanning raak, de route passend, de hefboom concreet en maandag-uitvoerbaar?
5. **Robuustheid** · hoe stabiel is de output over runs, en hoe gracieus faalt de keten?

> Diepere onderbouwing, codestructuur en denkwijze: zie `denken/2026-06-11-v3-scan-review-kennisdump.md`.