본문으로 건너뛰기

프로젝트 소개

개요

SceneMakerAI는 오픈소스 멀티모달 LLM을 활용하여 방송 콘텐츠(드라마, 예능, 보도, 다큐멘터리 등)를 재가공하는 오픈소스 AI 연구·엔지니어링 이니셔티브입니다.

본 프로젝트는 2026년 오픈소스 AI·SW 개발·활용 지원사업 (과학기술정보통신부, NIPA)의 일환으로 진행됩니다.

목표

  1. 오픈소스 모델 기반의 4대 AI 서비스 구축
    • 모아보기 — 하이라이트 자동 선별
    • 리믹스 — 숏폼 자동 생성
    • 광고 — 맥락 기반 광고 매칭
    • Batch — 대규모 배치 처리
  2. 오픈소스 생태계에 30건 이상의 기여 (Issue, PR, 데이터셋)
  3. 기술 블로그를 통한 20건 이상의 정기 게시 운영

기술 스택

  • Qwen3.5 (Apache 2.0) — 멀티모달 추론
  • LangGraph (MIT) — 워크플로우 오케스트레이션
  • vLLM — 추론 서빙
  • faster-whisper, librosa — 음성·음향 분석
  • Qdrant — 벡터 색인
  • Docusaurus — 본 문서 사이트

조직

  • 주관: 솔박스(Solbox Inc.)
  • 연락처: minsung7336 [at] solbox.com

라이선스

  • 사이트 콘텐츠: CC BY 4.0 (예정)
  • 코드 샘플 및 레퍼런스 구현: Apache 2.0 (예정)