Článek
Mezi běžná organická rozpouštědla patří ethanol a aceton, existují ale stovky dalších, která lze rovněž použít v chemických reakcích, píše web MIT News.
„Předpovídání rozpustnosti je skutečně limitujícím krokem při plánování a výrobě syntetických chemikálií, zejména léků,“ řekl Lucas Attia, postgraduální student MIT a jeden z hlavních autorů nové studie.
„Náš model je nesmírně užitečný, protože dokáže určit nejlepší rozpouštědlo, které mnohem méně poškozuje životní prostředí,“ dodal postgraduální student MIT a hlavní autor článku Jackson Burns.
Použití strojového učení
AI model vznikl v rámci projektu, na němž vědci Attia a Burns spolupracovali během kurzu MIT zaměřeného na využití strojového učení v chemickém inženýrství.
Tradičně chemici odhadují rozpustnost látek pomocí tzv. Abrahamova solvatačního modelu. Ten pracuje tak, že celkovou rozpustnost molekuly určí součtem příspěvků jednotlivých chemických struktur, z nichž se molekula skládá. Tyto odhady jsou sice cenné, ale jejich přesnost má své limity.
V posledních několika letech začali vědci používat strojové učení, aby se pokusili o přesnější předpovědi rozpustnosti. Předchozí modely totiž moc dobře nefungovaly. Důvodem byl především neexistující ucelený soubor dat, na kterém by je bylo možné trénovat.
V roce 2023 byla zpřístupněna nová databáze BigSolDB, jež shromáždila údaje z téměř 800 publikovaných studií, včetně informací o rozpustnosti asi 800 molekul rozpuštěných ve více než 100 organických rozpouštědlech běžně využívaných v syntetické chemii.
Attia a Burns zkusili na více než 40 000 datových bodech trénovat dva různé typy modelů, včetně informací o vlivu teploty, která hraje významnou roli v rozpustnosti – FastProp a ChemProp.
Poté modely otestovali na přibližně 1000 roztoků, které byly z tréninkových dat vynechány. Zjistili, že předpovědi modelů byly dvakrát až třikrát přesnější než předpovědi předchozího nejlepšího modelu. „Schopnost přesně reprodukovat tyto malé změny rozpustnosti v závislosti na teplotě byla opravdu pozitivním znamením,“ vysvětlil Burns.
Vědci předpokládají, že model postavený na technologii ChemProp bude schopný poskytovat přesnější předpovědi. Na druhou stranu FastProp předpovídá rychleji a má kód, jenž si mohou ostatní uživatelé snáze přizpůsobit. Attia s Burnsem se ho tak rozhodli zpřístupnit veřejnosti pod názvem FastSolv. Několik farmaceutických společností jej již začalo používat.