Hur hittar Web4Health svar till frågor som folk skriver i sökfältet på hemsidan? Hur fungerar det naturligt-språk-frågebesvarande system som används i Web4Health?
Svar:
Den naturligt-språk-besvarande funktionen i Web4health använder sig av ett system QuickAsk som utvecklats av forskaren Eriks Sneiders vid DSV. Med naturligt-språk fråge-besvarande besvarande menas datasystem som auotmatiskt kan generera goda svar på skriftliga frågor. Systemet kan hantera skriftligt språk men inte förståelse av språk.
Det finns två huvudsakliga metoder för naturligt-språk fråge-besvarande system. AI-metoden använder artificiell intelligens och lingvistiska metoder för att analysera och skapa en "förståelse" av frågor i datorn. Mallmetoden matchar frågor med meningar och fraser som är konstruerade av människor. Båda metoderna kan ge goda svar och kan för användaren ge ett intryck av "dataintelligens" .AI-metoden kräver komplexa och avancerade språkliga analysprogram.
Mallmetoden kräver noggrann design av mallar för varje fråga. Intelligensen, för mall-baserade metoder, ligger hos människorna som skriver mallarna. Mallarna kan endera vara specifika mallar för enskilda frågor, eller allmänna mallar för en grupp av frågor. Till exempel frågan: "vad är populationen i Sverige?", och "vad är populationen i Italien?", kan besvaras av samma mall, vilken används som tillgång till en databas.
Båda metoderna kräver en otroligt noggrann testning av användare och justering innan systemet är användbart. Det mest välkända mall-baserade natural-language question-answering-systemet är Ask Jeeves [http://www.ask.com], som är ett stort reklamsystem med svar på hundratusentals frågor. Eftersom det är en reklamservice, är inte dess design offentlig.
Faq-söksystem
En vanlig användning av Natural-Language Question-Answering är att söka i databaser av svar till vanliga frågor, FAQs.
Vårt system
Eriks Sneiders har konstruerat ett mallbaserat fråga-svarsystem. Du kan testa systemet på en databas om HTML på [http://dsv.su.se/html/].
En mall måste matcha många olika varianter av samma fråga. Till exempel "Hur stor är populationen av Sverige?", "Hur stort antal personer bor i Sverige?" och "Hur många invånare bor i Sverige?" är tre av de många varianter som bör ge samma svar tillbaka. En enkel mall för denna fråga i systemet kan specificeras som:popula* [numrera många mycket nr. människa* för personer*person*invånare*]; Swede* Sverige* Schwede* Suède*
Mallen fungerar så här:
- En fråga måste innehålla ett ord eller en fras som matchar texten före ";" och efter ";", som beskrivs med item 2 och 3 nedan.
- De matchande orden efter ";" är något av orden som börjar med antingen "Swede" eller "Sverige" eller "Schwede" eller "Suède".
- De matchande fraserna före ";" kan antingen vara
- ett ord som börjar med "popula" eller
- ett ord som börjar på "antal", "många" och "stor", och sedan, ett ord som börjar med "människ", "person", "invånare" or "folk". Tecknet "#" indikerar att andra ord tillåts förekomma mellan ord både före och efter tecknet"#".
På så sätt kan komplexa mallar konstrueras, "[...]" fraser kan vara ihopsatta med varandra i flera kombinationer inuti varandra.
Notera: Denna teknologi används endast på de tyska, engelska och svenska Web4Health-webbplatserna och delvis på den italienska webbplatsen. På den italienska och tyska delen av Web4Health används också flerspråkigt frågebesvarande.