Milena (Innocent Old Lady) - Anti-Scam AI - Gemini Competition 2024
🏆 Přihláška do Gemini API Developer Competition 2024
Datum
June 2024
Velikost týmu
2 členů
Technologie
Videa
Přehled
Inovativní anti-scam aplikace, která využívá AI k plýtvání časem podvodníků prostřednictvím napodobování konverzací s virtuální osobou, chrání potenciální oběti a dělá podvody méně ziskové.
Problém
Telefonní podvody zaměřené na seniory a zranitelné skupiny obyvatelstva jsou celosvětově rostoucím problémem způsobujícím každoročně ztráty v miliardách dolarů. Tradiční přístupy k boji proti podvodům jsou reaktivní - blokování známých čísel nebo vzdělávání potenciálních obětí. Podvodníci však neustále přizpůsobují své taktiky a zranitelné skupiny zůstávají v ohrožení. Je potřeba proaktivní řešení, které aktivně plýtvá časem podvodníků, činí jejich operace méně ziskovými a snižuje počet obětí, na které se mohou zaměřit.
Naše řešení
Milena je AI systém, který napodobuje skutečnou konverzaci s podvodníkem prostřednictvím virtuální persony. Když podvodník zavolá, systém plynule převezme hovor a simuluje konverzaci, která odráží typické fáze podvodu: Problém, Manipulace a Extrakce. Inteligentní analýzou řeči podvodníka pomocí Gemini API Milena reaguje způsobem, který prodlužuje interakci a efektivně zdržuje podvodníka. To nejen zabraňuje tomu, aby během této doby cílili na další oběti, ale také zvyšuje jejich provozní náklady, což činí proces podvádění méně ziskovým.
Klíčové funkce
- Analýza řeči v reálném čase: Využívá Gemini API k analýze vzorců řeči podvodníka a přiměřené reakci
- Přirozená konverzace: Generuje přesvědčivé odpovědi pomocí Gemini 2.0 Flash, které znějí jako skutečná osoba
- Převod textu na řeč: Převádí AI generované odpovědi na přirozeně znějící řeč pomocí ElevenLabs
- Rozpoznání fáze podvodu: Identifikuje, ve které fázi podvodu (Problém, Manipulace, Extrakce) se podvodník nachází, a reaguje odpovídajícím způsobem
- Strategie zapojení podvodníka: Strategicky prodlužuje konverzace, aby udržela podvodníky zaneprázdněné, čímž snižuje čas, který mohou věnovat skutečným obětem
Rychlé schopnosti Gemini API ve zpracování přirozeného jazyka v kombinaci s realistickým převodem textu na řeč od ElevenLabs zajišťují, že odpovědi jsou včasné a přesvědčivé, což vytváří věrohodnou konverzační zkušenost.
Moje role
Jako člen 2členného týmu jsem se podílel na tvorbě nápadu, vývoji softwaru a návrhu AI pipeline. Moje přínosy zahrnovaly návrh konverzační AI logiky, integraci Gemini API pro porozumění a generování přirozeného jazyka, implementaci pipeline pro převod řeči na text a textu na řeč a spolupráci na celkové architektuře systému. Projekt představuje náš přístup k využití AI pro společenské dobro - obrácení taktik podvodníků proti nim samotným za účelem ochrany zranitelných skupin obyvatelstva.