import os
import sys
import gc
import tempfile
from pathlib import Path

# 권한 문제 해결을 위한 환경 변수 설정 (최상단에 위치)
temp_dir = tempfile.gettempdir()
os.environ["STREAMLIT_HOME"] = temp_dir
os.environ["STREAMLIT_CONFIG_DIR"] = os.path.join(temp_dir, ".streamlit")
os.environ["STREAMLIT_SERVER_HEADLESS"] = "true"
os.environ["STREAMLIT_BROWSER_GATHER_USAGE_STATS"] = "false"
os.environ["TOKENIZERS_PARALLELISM"] = "false"

# 캐시 디렉토리도 temp로 설정
os.environ["TRANSFORMERS_CACHE"] = os.path.join(temp_dir, "transformers_cache")
os.environ["HF_HOME"] = os.path.join(temp_dir, "huggingface")

# PyTorch 클래스 경로 충돌 해결
try:
    import torch
    import importlib.util
    torch_classes_path = os.path.join(os.path.dirname(importlib.util.find_spec("torch").origin), "classes")
    if hasattr(torch, "classes"):
        torch.classes.__path__ = [torch_classes_path]
except Exception:
    pass

import streamlit as st

# transformers 라이브러리 import 및 상태 체크
try:
    from transformers import AutoTokenizer, AutoModelForCausalLM
    import torch
    TRANSFORMERS_AVAILABLE = True
except ImportError as e:
    TRANSFORMERS_AVAILABLE = False
    st.error(f"Transformers 라이브러리를 불러올 수 없습니다: {e}")

# 페이지 설정
st.set_page_config(
    page_title="TinyLlama Demo",
    page_icon="🦙",
    layout="wide",
    initial_sidebar_state="expanded"
)

st.title("🦙 TinyLlama 1.1B (CPU 전용) 데모")

if not TRANSFORMERS_AVAILABLE:
    st.error("필요한 라이브러리를 설치해주세요:")
    st.code("""
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu
pip install transformers
pip install streamlit
    """, language="bash")
    st.stop()

@st.cache_resource(show_spinner=False)
def load_tinyllama_model():
    """TinyLlama 1.1B 모델 로드 (CPU Only)"""
    try:
        # 여러 가능한 모델 이름 시도
        model_options = [
            "TinyLlama/TinyLlama-1.1B-intermediate-step-1431k-3T",
            "TinyLlama/TinyLlama-1.1B-Chat-v1.0",
            "microsoft/DialoGPT-small"  # 백업 옵션
        ]
        
        for model_name in model_options:
            try:
                st.info(f"모델 시도 중: {model_name}")
                
                # 토크나이저 로드
                tokenizer = AutoTokenizer.from_pretrained(
                    model_name,
                    trust_remote_code=True,
                    cache_dir=os.environ.get("TRANSFORMERS_CACHE")
                )
                
                # 모델 로드
                model = AutoModelForCausalLM.from_pretrained(
                    model_name,
                    torch_dtype=torch.float32,
                    trust_remote_code=True,
                    cache_dir=os.environ.get("TRANSFORMERS_CACHE"),
                    device_map="cpu"
                )
                
                # CPU로 명시적 이동 및 평가 모드
                model = model.to("cpu")
                model.eval()
                
                # 토크나이저 설정
                if tokenizer.pad_token is None:
                    tokenizer.pad_token = tokenizer.eos_token
                
                # 메모리 정리
                gc.collect()
                
                return model, tokenizer, f"✅ {model_name} 로드 성공!"
                
            except Exception as model_error:
                st.warning(f"{model_name} 로드 실패: {str(model_error)}")
                continue
        
        return None, None, "❌ 모든 모델 로드 실패"
        
    except Exception as e:
        return None, None, f"❌ 전체 로드 실패: {str(e)}"

def generate_text(model, tokenizer, prompt, max_new_tokens=150, temperature=0.7):
    """안전한 텍스트 생성 함수"""
    try:
        # 입력 길이 제한
        max_input_length = 400
        
        # 토큰화
        inputs = tokenizer(
            prompt,
            return_tensors="pt",
            truncation=True,
            max_length=max_input_length,
            padding=False
        )
        
        # CPU로 이동
        inputs = {k: v.to("cpu") for k, v in inputs.items()}
        input_length = inputs['input_ids'].shape[1]
        
        # 안전한 생성 길이 계산
        safe_max_tokens = min(max_new_tokens, 800 - input_length)
        if safe_max_tokens < 20:
            safe_max_tokens = 20
        
        # 생성 설정
        generation_kwargs = {
            "max_new_tokens": safe_max_tokens,
            "temperature": temperature,
            "do_sample": True,
            "top_p": 0.9,
            "top_k": 50,
            "repetition_penalty": 1.1,
            "pad_token_id": tokenizer.pad_token_id or tokenizer.eos_token_id,
            "eos_token_id": tokenizer.eos_token_id,
            "use_cache": True,
            "early_stopping": True
        }
        
        # 메모리 정리
        gc.collect()
        
        # 생성 실행
        with st.spinner("텍스트 생성 중..."):
            with torch.no_grad():
                outputs = model.generate(
                    **inputs,
                    **generation_kwargs
                )
        
        # 새로 생성된 부분만 추출
        new_tokens = outputs[0][input_length:]
        generated_text = tokenizer.decode(new_tokens, skip_special_tokens=True)
        
        return generated_text.strip()
        
    except Exception as e:
        raise Exception(f"생성 중 오류: {str(e)}")

def main():
    # 모델 로드
    with st.spinner("TinyLlama 모델 로딩 중... (처음 실행 시 다운로드로 인해 시간이 걸릴 수 있습니다)"):
        model, tokenizer, status = load_tinyllama_model()
    
    st.info(status)
    
    if not (model and tokenizer):
        st.error("모델 로드에 실패했습니다. 인터넷 연결을 확인하고 다시 시도해주세요.")
        return
    
    # 사이드바 설정
    st.sidebar.header("⚙️ 생성 설정")
    max_new_tokens = st.sidebar.slider("최대 새 토큰 수", 20, 200, 100)
    temperature = st.sidebar.slider("Temperature (창의성)", 0.1, 1.0, 0.7, 0.1)
    
    # 도움말
    st.sidebar.header("📖 사용 가이드")
    st.sidebar.info("""
    **Tips:**
    - 프롬프트는 명확하고 간결하게
    - CPU 전용이므로 생성에 시간이 걸립니다
    - 첫 실행 시 모델 다운로드로 시간이 더 걸립니다
    """)
    
    # 메인 인터페이스
    st.header("💬 텍스트 생성")
    
    # 예제 프롬프트
    col1, col2 = st.columns([2, 1])
    
    with col1:
        example_prompts = [
            "사용자 정의 입력",
            "The future of artificial intelligence is",
            "Once upon a time in a magical forest,",
            "Python is a programming language that",
            "Climate change is an important issue because",
            "The benefits of reading books include"
        ]
        
        selected_prompt = st.selectbox("예제 프롬프트 선택:", example_prompts)
    
    with col2:
        st.write("") # 공간 확보
        st.write("") # 공간 확보
        if st.button("🎲 랜덤 예제", help="랜덤한 예제 프롬프트 선택"):
            import random
            random_prompt = random.choice(example_prompts[1:])  # 첫 번째 제외
            st.session_state.random_prompt = random_prompt
    
    # 프롬프트 입력
    if selected_prompt == "사용자 정의 입력":
        default_prompt = st.session_state.get('random_prompt', '')
        prompt = st.text_area(
            "프롬프트를 입력하세요:",
            value=default_prompt,
            height=100,
            placeholder="여기에 텍스트를 입력하세요..."
        )
    else:
        prompt = st.text_area(
            "프롬프트:",
            value=selected_prompt,
            height=100
        )
    
    # 토큰 수 표시
    if prompt and tokenizer:
        try:
            token_count = len(tokenizer.encode(prompt))
            st.caption(f"현재 프롬프트 토큰 수: {token_count}")
            if token_count > 400:
                st.warning("⚠️ 프롬프트가 너무 깁니다. 400 토큰으로 자동 잘림됩니다.")
        except:
            pass
    
    # 생성 버튼
    col1, col2, col3 = st.columns([1, 1, 2])
    
    with col1:
        generate_btn = st.button("🚀 생성 시작", type="primary", use_container_width=True)
    
    with col2:
        clear_btn = st.button("🗑️ 결과 지우기", use_container_width=True)
    
    # 결과 지우기
    if clear_btn:
        if 'generated_result' in st.session_state:
            del st.session_state['generated_result']
        st.rerun()
    
    # 텍스트 생성
    if generate_btn and prompt.strip():
        try:
            # 생성 진행률 표시
            progress_container = st.container()
            with progress_container:
                progress_bar = st.progress(0)
                status_text = st.empty()
                
                status_text.text("토큰화 중...")
                progress_bar.progress(20)
                
                status_text.text("텍스트 생성 중... (CPU에서 실행되므로 시간이 걸립니다)")
                progress_bar.progress(40)
                
                # 실제 생성
                generated_text = generate_text(
                    model, tokenizer, prompt.strip(),
                    max_new_tokens, temperature
                )
                
                progress_bar.progress(80)
                status_text.text("결과 처리 중...")
                
                # 결과 저장
                full_result = prompt + generated_text
                st.session_state['generated_result'] = {
                    'prompt': prompt,
                    'generated': generated_text,
                    'full_text': full_result
                }
                
                progress_bar.progress(100)
                status_text.text("완료!")
                
                # 진행률 표시 제거
                progress_bar.empty()
                status_text.empty()
                
        except Exception as e:
            st.error(f"생성 중 오류가 발생했습니다: {str(e)}")
            st.info("💡 다시 시도하거나 더 짧은 프롬프트를 사용해보세요.")
    
    elif generate_btn:
        st.warning("⚠️ 프롬프트를 입력해주세요.")
    
    # 결과 표시
    if 'generated_result' in st.session_state:
        result = st.session_state['generated_result']
        
        st.header("📝 생성 결과")
        
        # 탭으로 구분
        tab1, tab2 = st.tabs(["🎯 생성된 텍스트만", "📄 전체 텍스트"])
        
        with tab1:
            st.markdown("**새로 생성된 부분:**")
            st.markdown(f'<div style="background-color: #f0f2f6; padding: 15px; border-radius: 10px; border-left: 4px solid #4CAF50;">{result["generated"]}</div>', unsafe_allow_html=True)
        
        with tab2:
            st.markdown("**전체 텍스트 (프롬프트 + 생성):**")
            st.text_area(
                "전체 결과:",
                value=result['full_text'],
                height=200,
                disabled=True
            )
        
        # 다운로드 버튼
        st.download_button(
            label="💾 텍스트 파일로 저장",
            data=result['full_text'],
            file_name=f"tinyllama_output_{len(result['full_text'])}.txt",
            mime="text/plain",
            use_container_width=True
        )
    
    # 시스템 정보 사이드바
    st.sidebar.header("💻 시스템 정보")
    st.sidebar.write(f"**Python:** {sys.version.split()[0]}")
    if TRANSFORMERS_AVAILABLE:
        st.sidebar.write(f"**PyTorch:** {torch.__version__}")
        st.sidebar.write(f"**CUDA 사용 가능:** {'✅' if torch.cuda.is_available() else '❌'}")
        st.sidebar.write(f"**실행 모드:** CPU 전용")
    
    # 성능 팁
    with st.sidebar.expander("🚀 성능 최적화 팁"):
        st.markdown("""
        **속도 향상:**
        - 프롬프트를 100단어 이하로 유지
        - 토큰 수를 150개 이하로 제한
        - 여러 탭에서 동시 실행하지 않기
        
        **메모리 절약:**
        - 다른 무거운 애플리케이션 종료
        - 브라우저 탭 최소화
        """)

if __name__ == "__main__":
    main()