|
--- |
|
title: Document Analysis Chatbot |
|
emoji: 🚀 |
|
colorFrom: red |
|
colorTo: red |
|
sdk: docker |
|
app_port: 8501 |
|
tags: |
|
- streamlit |
|
pinned: false |
|
short_description: Document Analysis Chatbot with Implicit Caching |
|
license: apache-2.0 |
|
--- |
|
|
|
# Document Analysis Chatbot with Gemini AI |
|
|
|
## Tính năng |
|
|
|
- ✅ **Upload tài liệu**: Hỗ trợ PDF, MARKDOWN, DOC/DOCX, TXT |
|
- ✅ **Tóm tắt tài liệu**: Tự động tạo tóm tắt chi tiết |
|
- ✅ **Chat với tài liệu**: Đặt câu hỏi và nhận câu trả lời dựa trên nội dung |
|
- ✅ **Xác minh thông tin**: Kiểm tra tính chính xác của thông tin so với tài liệu |
|
- ✅ **Kiểm tra tuân thủ**: So sánh với Nghị định 13/2023/NĐ-CP về bảo vệ dữ liệu cá nhân |
|
|
|
## Cài đặt |
|
|
|
1. **Clone hoặc tải về project** |
|
2. **Cài đặt dependencies:** |
|
|
|
```bash |
|
pip install -r requirements.txt |
|
``` |
|
|
|
3. **Lấy Gemini API Key:** |
|
|
|
- Truy cập [Google AI Studio](https://aistudio.google.com/app/apikey) |
|
- Click Create API Key |
|
- Sao chép API Key |
|
- Tạo 1 file .env trong thư mục gốc để chứa thông tin trường GEMINI_API_KEY bạn cừa copy |
|
|
|
```env |
|
GEMINI_API_KEY=<API Key của bạn> |
|
``` |
|
|
|
## Chạy ứng dụng |
|
|
|
```bash |
|
streamlit run app.py |
|
``` |
|
|
|
## Hướng dẫn sử dụng |
|
|
|
1. **Upload tài liệu**: Chọn file cần phân tích (PDF/MD/DOC/DOCX/TXT) |
|
2. **Sử dụng các tính năng** qua các tab: |
|
- **Chat**: Đặt câu hỏi về tài liệu |
|
- **Tóm tắt**: Xem tóm tắt tự động |
|
- **Xác minh**: Kiểm tra thông tin |
|
- **Kiểm tra tuân thủ**: Phát hiện vi phạm bảo vệ dữ liệu |
|
|
|
## Cấu trúc Project |
|
|
|
``` |
|
Final Project/ |
|
├── .env # File môi trường |
|
├── app.py # Ứng dụng chính |
|
├── requirements.txt # Dependencies |
|
└── README.md # Hướng dẫn này |
|
``` |
|
|
|
## Lưu ý |
|
|
|
- Ứng dụng cần kết nối internet để sử dụng Gemini API |
|
- API Key được lưu trong session, không lưu trữ lâu dài |
|
- Hỗ trợ tiếng Việt trong giao diện và phản hồi |
|
|