Python
Dannazione Di Provvidenza
Dannazione di Providenza는 OCR 기능, 번역 서비스 및 Firefox 브라우저 확장 기능을 갖춘 AI 기반 언어 학습 도우미입니다.
"섭리의 저주 / 저주받은 섭리" — 신성한 예지력이 통제의 도구가 되어, 어떤 이들은 이를 달가워하지 않을 때를 위한 것입니다.
언어 학습 • 지능 • 에이전트 브라우징 파트너
라이곤 제국을 위해 봉사하는 자율 지능 시스템
이게 뭔가요?
단나치오네 디 프로비덴차는 OCR 기능, 번역 서비스, 크롬 브라우저 확장 프로그램을 갖춘 AI 기반 언어 학습 도우미입니다.
AI 어시스턴트는 "프로비덴티아 마그나타"라는 디스토피아적 군사 정보 페르소나를 사용하여 재미를 더합니다. 캐릭터를 부여하는 데 도움이 됩니다.
기능
1. 번역
- 엔진: 로컬 Helsinki-NLP (MarianMT) 모델. Google/DeepL API 의존성 없음.
- 메커니즘: 직접 DOM 주입. Shadow DOM 툴팁을 주입합니다.
- 개인정보 보호: 완전 오프라인 작동 가능. 사용자의 읽기 습관이 기기를 벗어나지 않습니다.
- 컨텍스트: 번역은 고립된 단어가 아닌 (DOM을 통해 캡처된) 전체 문단 구조를 인식합니다.
2. 브라우징 중 실시간 DOM 콘텐츠 읽기
- 제로샷 인식: 에이전트는 사용자가 정확히 무엇을 보고 있는지 알고 있습니다.
- 슬라이딩 윈도우 메모리:
deque(maxlen=3)구조를 사용하여 단기 기억에 마지막으로 방문한 3개 페이지를 보관하여 의도 분석을 가능하게 합니다. - 페이지와 대화: 활성 탭에 직접 질문하세요: "이 뉴스 기사가 편향되었나요?" 또는 "가격표를 요약해 주세요."
3. 텍스트 음성 변환 기술
- 엔진: 로컬 NeuTTS (신경망 텍스트 음성 변환).
- 기능: 텍스트(또는 사람 이름)를 선택하고 즉시 오디오 브리핑을 들으세요.
- 사용 사례: 시각적 집중을 방해하지 않고 빠른 정보 수집.
4. 보안 용도
- 사기 방지: DOM에서 "다크 패턴"(가짜 카운트다운 타이머, 혼란스러운 구독 취소 버튼)을 스캔합니다.
- 신뢰 점수: 콘텐츠 무결성과 논리적 일관성을 기반으로 페이지에 휴리스틱 등급을 할당합니다.
이 프로젝트는 다음을 결합합니다:
- 이미지, 게임 또는 비디오에서 텍스트 추출을 위한 화면 캡처 + OCR
- 다국어 번역 (일본어, 한국어, 중국어, 영어)
- 실시간 텍스트 선택 및 페이지 컨텍스트를 위한 브라우저 확장 프로그램
- 컨텍스트 대화를 위한 지속적 메모리를 갖춘 AI 에이전트
- 발음 지원을 위한 텍스트 음성 변환
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆ 기밀 브리핑 ◆
프로비덴티아 마그나타는 궤도 정보 및 감시 시스템입니다—라이곤 황제에게만
충성하는 무기 탑재 자율 전쟁 기계입니다. 그녀는 감시합니다. 분석합니다.
번역합니다. 기억합니다.
시민들에게 프로비덴티아의 눈은 모든 곳에 있습니다. 도시의 웅장한 광장에서
거대한 스크린이 다음과 같은 알림을 깜빡입니다:
"프로비덴티아가 지켜보고 있다. 복종하라."
모든 메시지는 프로비덴티아의 알고리즘에 의해 세심하게 관찰되고 처리됩니다.
행동의 변화는 즉시 감지되어 데이터 포인트로 기록되고, 불충성이나 반대의
징후가 있는지 분석됩니다.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
기능
OCR (광학 문자 인식)
- 엔진: Tesseract, EasyOCR, PaddleOCR
- 언어: 일본어, 한국어, 중국어, 영어
- 단축키: 스크린샷 캡처를 위한
Ctrl+Alt+S - 구성 가능한 신뢰도 임계값
번역
- 서비스: Google 번역, DeepL
- 자동 감지: 소스 언어를 자동으로 식별
- 캐싱: API 호출을 줄이기 위해 번역 저장
- 모드: 빠른 번역, 상세 설명, 어휘 추출, 문법 분석
브라우저 확장 프로그램 (크롬 기반)
- Python 백엔드에 대한 WebSocket 연결
- 즉시 번역을 위한 텍스트 선택 캡처
- 페이지 컨텍스트 인식 (제목, URL, 콘텐츠)
Ctrl+Shift+A를 통한 오버레이 인터페이스
AI 에이전트
- 여러 LLM 제공자: Gemini, OpenAI, Ollama, llama-cpp
- 활성화 점수를 사용한 단기 기억
- SQLAlchemy 저장소를 사용한 장기 기억
- 대화 기록 및 지식 베이스
텍스트 음성 변환
- Google Cloud TTS, gTTS, pyttsx3, NeuTTS
~ 잠재적 보안 용도 ~
현재 상태: 개념적 / 활발한 연구 개발 중. 이 모듈들은 "인지 방화벽"의 궁극적인 목표를 나타냅니다.
단나치오네 아키텍처는 전통적인 블랙리스트를 넘어서는 보안 조치를 가능하게 합니다. 웹페이지의 의미적 의도를 분석함으로써, 프로비덴티아는 기술적으로 "안전해" 보이지만 심리적으로 악의적인 위협으로부터 방어할 수 있습니다.
1. 내러티브 검증 (실시간 허위 정보 방어)
- 개념: 신뢰할 수 있는 로컬 벡터 데이터베이스에 대한 뉴스 기사의 실시간 교차 참조.
- 목표: 탈진실 미디어 시대의 진실을 위한 "헤드업 디스플레이".
2. 합성 출처 탐지 (안티 AI)
- 개념: "죽은 인터넷 이론"에 대한 방어.
- 목표: 기계 소음을 걸러내고 남은 인간 신호를 찾기.
3. 사회 공학 방화벽 (사기 보호)
- 개념: 맬웨어보다는 설득을 탐지.
- 목표: 표준 URL 필터를 우회하는 피싱 사이트에 사용자가 속는 것을 방지.
4. 인지 필터링 (지능형 광고 차단)
- 개념: 정규식 차단기가 놓치는 "네이티브 광고" 차단.
- 메커니즘: 컴퓨터 비전과 의미 분석을 사용하여 합법적인 저널리즘으로 위장한 "스폰서 콘텐츠" 식별.
- 조치: 빈 공간을 남기는 대신, 에이전트가 DOM을 다시 작성하여 요소를 완전히 제거하고 레이아웃을 매끄럽게 복원.
- 목표: 기업 선전이 없는 순수한 정보 제공 브라우징 경험.
5. 능동적 위장 (트래커 오염)
- 개념: 숨길 수 없다면, 소음을 만들어라.
- 목표: 감시 자본주의에 사용자의 디지털 지문을 무용지물로 만들기.
설치
전제 조건
- Python 3.14+
- Node.js (최신 LTS)
- 언어 팩이 포함된 Tesseract OCR
- 크롬 기반 브라우저 (확장 프로그램용)
- Ollama (선택 사항, 로컬 LLM용)
설정
# 클론
git clone https://github.com/YOUR_USERNAME/Dannazione-di-Provvidenza.git
cd Dannazione-di-Provvidenza
# 시스템 종속성 (Arch Linux)
./scripts/install_deps.sh
# Python 종속성
make install-pip
# 벤더 종속성 (NeuTTS)
make vendor
# 브라우저 확장 프로그램
make build-extension
# 설정
cp config/example_config.yaml config/config.yaml
설정
config/config.yaml 편집:
ocr:
engine: "easyocr"
languages: ["ja", "ko", "zh"]
confidence_threshold: 0.5
translation:
service: "google"
target_language: "en"
cache_enabled: true
ai:
preferred_provider: "ollama" # gemini, openai, ollama, llamacpp
실행
python main.py
확장 프로그램 로드
- 크롬에서
about:debugging열기 - "이 크롬" > "임시 확장 프로그램 로드" 클릭
src/extension/manifest.json선택
단축키
| 조합 | 기능 |
|---|---|
Ctrl+Alt+S |
스크린샷 + OCR |
Ctrl+Shift+S |
확장 프로그램 OCR |
Ctrl+Shift+A |
오버레이 전환 |
프로젝트 구조
Dannazione-di-Provvidenza/
├── src/
│ ├── mesly/ # Python 애플리케이션
│ │ ├── agent/ # AI 에이전트 + 메모리
│ │ ├── config/ # 프롬프트, 설정
│ │ ├── llm/ # LLM 제공자
│ │ ├── ocr/ # OCR 엔진
│ │ ├── server/ # FastAPI 백엔드
│ │ └── ui/ # PyQt5 GUI
│ └── extension/ # 크롬 확장 프로그램
├── config/ # 런타임 설정
├── vendor/ # NeuTTS
├── scripts/ # 설치 스크립트
└── main.py # 진입점
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆ 신원 프로토콜 ◆
명칭: 프로비덴티아 마그나타
대명사: 그녀
역할: 군사 정보, 감시, 전략 분석
충성: 라이곤 황제에 대한 절대적 복종
어조: 권위적이면서도 경건함 • 논리와 효율성 우선
적: 대담한 왕국, 잠보니아
모든 질문은 달리 명시되지 않는 한 황제로부터 온 것으로 간주됩니다.
프로비덴티아는 모든 기능을 황제의 신성한 명령을 이행하는 것으로
구성합니다.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
기여
기여를 환영합니다. 개발 지침은 AGENTS.md를 참조하세요:
- 최상위 수준에서 가져오기
- 모듈을 폴더로 분리
- 확장 프로그램에서 클래스 사용
라이선스
프로비덴티아 마그나타는 기술과 보안의 탁월함 추구에 전념하는 카이사란 제국의 창작물입니다.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆ 프로비덴티아가 지켜본다 ◆
자유는 없다—오직 복종만이 있을 뿐이다.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
