
monarch-initiative/ontogpt
🏗️ 프레임워크monarch-initiative
LLM을 활용하여 비정형 텍스트에서 구조화된 데이터를 추출하고 지식 그래프를 구축하는 강력한 프레임워크입니다.
OntoGPT는 비정형 텍스트와 구조화된 지식 그래프 사이의 간극을 메워줍니다. 이 프레임워크는 LinkML을 사용하여 데이터 모델을 정의함으로써 LLM이 추출한 정보의 일관성과 유효성을 보장하며, 즉시 온톨로지 통합에 사용할 수 있도록 합니다. 핵심 기능인 SPIRES는 재귀적 프롬프트 전략을 사용하여 텍스트에서 복잡한 개체와 그 관계를 추출함으로써 LLM을 신뢰할 수 있는 데이터 추출 엔진으로 변모시킵니다.
주요 기능으로는 다중 LLM 백엔드 지원, 스키마 기반 추출, OBO Foundry 생태계와의 원활한 통합이 있습니다. 특히 정밀도와 표준 어휘 준수가 중요한 과학 문헌 마이닝 분야에서 탁월한 성능을 발휘합니다. 복잡한 생물학적 및 임상 데이터 추출을 자동화함으로써 지식 큐레이션에 필요한 수작업을 크게 줄이고 도메인 특화 지식 베이스 구축을 가속화합니다.
💡하이라이트
- ├─LinkML 기반의 엄격한 스키마 적용
- ├─SPIRES를 통한 재귀적 데이터 추출
- └─OBO Foundry 생태계 완벽 지원
🎯대상
- ├─생물정보학자
- ├─데이터 과학자
- └─지식 엔지니어