Ruští vědci vyvíjejí platformu pro rozpoznávání chorob rostlin z fotografií

Zaměstnanci Laboratoře informačních technologií JINR vyvinuli online platformu pdd.jinr.ru pro identifikaci chorob domácích a zemědělských rostlin. K vyřešení problému byly použity konvoluční neuronové sítě, které jsou široce používány pro klasifikaci obrazu. Architektura neuronové sítě platformy je schopna rozpoznat různé choroby a škůdce s přesností více než 95 %. Na začátku roku 2023 byl počet tříd v obecném modelu pdd.jinr.ru zvýšen na 60 a objevilo se několik nových specializovaných modelů pro tak oblíbené pokojové rostliny, jako je dracaena a spathiphyllum.

Podle Organizace OSN pro výživu a zemědělství až třetina světové úrody ročně zahyne kvůli škůdcům a chorobám, takže automatizace rozpoznávání chorob rostlin se nyní provádí po celém světě. V roce 2017 získala skupina výzkumníků z Laboratoře informačních technologií JINR grant od Ruské nadace pro základní výzkum (RFBR) na vývoj komplexního systému pro diagnostiku chorob rostlin pomocí obrázků a textových popisů.
Byla vyvinuta platforma, která se dodnes rozvíjí a má několik vstupních bodů pro uživatele. Implementuje kolekci modelů: při zpracování požadavku algoritmus nejprve použije obecný model pro choroby a škůdce. Poté neuronová síť určí druh rostliny. Za předpokladu, že daná plodina má svůj vlastní model, uživatel obdrží kromě obecné také konkrétní prognózu. „Při vystavení výsledku se zobrazí tři nejbližší třídy k načtenému obrázku. Ve většině případů to vše umožňuje správně identifikovat chorobu a získat doporučení pro její léčbu,“ uvedl spoluautor studie, vedoucí programátor JINR LIT Alexandr Užinskij.
Nyní má pdd.jinr.ru modely pro 19 zemědělských a okrasných plodin: dřišťál, hrozny, třešně, borůvky, jahody, kukuřice, okurky, papriky, pšenice, rybíz, rajčata, bavlna, jablka, orchideje, růže atd. Obecný model pro všechny druhy rostlin rozeznává 55 různých chorob a škůdců. Databáze obsahuje přes 4 obrázků; obdržel více než 000 40 požadavků od uživatelů. Rozhraní platformy může využívat každý, od zemědělských podniků až po začínající zahrádkáře, pro které budou důležitou součástí programu doporučení pro ošetření rostlin ověřená profesionálními agronomy.
„Uživatelé by měli mít k dispozici různé nástroje pro interakci s platformou. Úkoly rozpoznávání lze spouštět přes webový portál, ale hlavním vstupním bodem pro uživatele se stala mobilní aplikace DoctorP pro operační systém Android,“ vysvětlil Alexander Uzhinsky. Od spuštění aplikace ji využilo více než 10 000 lidí. V současné době se vyvíjí aplikace pro OS iOS.
Jak vysvětlil Alexandr Užinskij, pro klasifikaci obrázků se často používá osvědčená konvoluční neuronová síť, dříve trénovaná na velkém počtu obrázků. Její poslední vrstva, zodpovědná za klasifikaci, je nahrazena novou a následně probíhá další trénování na fotografiích z dané oblasti – tento přístup se nazývá „transferové učení“. K použití metody jsou zpravidla zapotřebí stovky obrázků. Zde se vědci potýkali s největší obtíží – shromážděním dostatečného počtu fotografií rostlin pro trénování neuronové sítě. Otevřené databáze dostupné v té době obsahovaly syntetické obrázky, které se velmi lišily od těch, se kterými se setkáváme v reálném životě: každý list byl odříznutý, narovnaný, byl na statickém pozadí a osvětlený stejným způsobem. „Tyto obrázky se dají pohodlně používat pro vědecké účely a dosáhli jsme dobrého výsledku – 99% rozpoznání, ale pak na fotografii pořízené uživateli v reálném životě model udělal chyby v 50 % případů. Stáli jsme před úkolem shromáždit databázi obrázků sami,“ pokračoval Alexandr Užinskij. Bylo nutné shromáždit co nejvíce snímků rostlin v terénu: za různého osvětlení, polohy, různých měřítků snímání atd. Obvykle jsou pro každou třídu, která má být určena, zapotřebí stovky, nebo ještě lépe tisíce snímků, aby se dosáhlo pozitivních výsledků.
V otevřených zdrojích: v online komunitách, na fórech – pro každou třídu chorob bylo pouze 20 až 50 obrázků a vývojáři museli použít speciální metody, aby i v podmínkách malého trénovacího vzorku dosáhli dobrého výsledku. K řešení problému byla použita siamská (dvojitá) neuronová síť, která, ačkoli se dříve nepoužívala ke klasifikaci rostlinných chorob, dobře rozlišovala tváře. „Tato technologie využívá identické sítě, kterým jsou na vstupu přiváděny dvojice obrázků stejných nebo různých tříd, a v důsledku trénování by se síť měla naučit dobře rozkládat vícerozměrné vektory obrázků různých tříd v prostoru vlastností. Díky tomu bylo při určování rostlinných chorob možné dosáhnout 98% přesnosti,“ komentoval vědec.
Platforma byla dvakrát optimalizována z důvodu zhoršení přesnosti výsledků s nárůstem počtu obrazových tříd v databázi. Poprvé byla za účelem zlepšení predikčních ukazatelů použita tříčlenná funkce minimalizace ztrát – přístup, který využívá tři neuronové sítě, kterým jsou přiváděny dva obrazy jedné třídy a jeden obraz druhé. Trénovací proces je zaměřen na to, aby se vektorové reprezentace obrazů jedné třídy v multidimenzionálním prostoru přiblížily a vektory obrazů různých tříd co nejvíce vzdálily.
Dalším krokem k optimalizaci architektury a procesu učení bylo použití algoritmů pro hledání optimálního nastavení augmentace (AutoAugment) – umělá změna obrázků, na kterých je neuronová síť trénována, pokud je těchto obrázků málo (například úhel objektu, změní se jas, část objektu se ořízne atd.). Kromě toho byla základní neuronová síť v platformě sítí speciálně trénovanou na různé obrázky rostlin. Výsledkem je, že i při více než 50 třídách si systém zachovává přesnost modelu přes 95 %.
Platforma se nadále vyvíjí. Databáze je aktualizována uživatelskými obrázky a tím se zlepšuje přesnost modelů. V létě platforma obsahuje hlavně obrázky zemědělských plodin: okurky, rajčata, jahody a další, v zimě – většinou fotografie pokojových rostlin. V budoucnu bude platforma doplněna o schopnost zpracovávat video streamy, modely pro zjišťování nedostatku základních prvků (dusík, fosfor, vápník, železo atd.) a také nástroje pro generování doporučení pro pěstování a sledování vývoj nejoblíbenějších zemědělských plodin.