Rychleji než člověk
Různé typy extrakce včetně tabulek
Ušetříme 6 měsíců ruční práce
Německá firma LECTURA poskytuje informace o těžké technice: zemědělských a stavebních strojích, jeřábech apod. Ve své databázi na webových stránkách má desetitisíce modelů a u každého z nich je dostupná technická specifikace v PDF.
Společnost chtěla dosáhnout lepších SEO výsledků ve vyhledávačích, nabídnout přesné výsledky v úzce definované oblasti a odlišit se od konkurence. Tak obrovský objem textů technické specifikace však není možné zpracovat ručně, proto se obrátili na nás. Cílem naší práce bylo parafrázovat anglické katalogové texty, aby byly unikátní, odlišily se od ostatních a dostaly se díky tomu na lepší pozici ve vyhledávačích. Pomáháme tak zákazníkům úzce specializované oblasti najíst přesně ty výsledky, které hledají.
K tomu jsme použili náš nástroj k parafrázování, který si v demo verzi můžete vyzkoušet také. Ten navíc texty přeformuluje tak, aby lépe reflektovaly terminologii, kterou používají lidé při vyhledávání.
„Můžeme tak s nadsázkou tvrdit, že umíme pomocí algoritmů přepsat obsah do řeči uživatelů,“ doplňuje Michal Štefánik, náš datový specialista se zaměřením na zpracování přirozeného jazyka a strojové učení.
K parafrázování používáme generativní jazykový model trénovaný na velikém korpusu textů. Nejdříve jej naučíme na datech klienta specifickou terminologii a poté do něj dostaneme klíčová slova, přes něž uživatelé nejčastěji na produktovou stránku chodí. Nakonec nastavíme model tak, aby při parafrázování používal tato vybraná klíčová slova. Díky tomu se texty umisťují na lepší pozici ve vyhledávači.
Již neplatí, že je AI aplikovatelná jen u malého množství standardních případů – a naše spolupráce je toho důkazem. Víme, jakými metodami umožnit umělé inteligenci se adaptovat, pokud je známá doména aplikace.
LECTURA is the leading provider of machinery intelligence supporting over 1M visitors monthly.