import os
import pandas as pd
from geopy.distance import geodesic
from tkinter import Tk
from tkinter.filedialog import askopenfilename, askdirectory

# 創建文件選取視窗
Tk().withdraw()  # 隱藏主視窗
print("請選擇處理模式:1. 單一檔案  2. 批次處理資料夾")
mode = input("輸入模式代碼 (1 或 2): ")

if mode == '1':
    print("請選擇原始 CSV 檔案...")
    file_path = askopenfilename(filetypes=[("CSV files", "*.csv")])

    if not file_path:
        print("未選擇檔案,程式退出。")
        exit()

    file_paths = [file_path]  # 將單一檔案放入列表,統一處理流程

elif mode == '2':
    print("請選擇包含 CSV 檔案的資料夾...")
    folder_path = askdirectory()

    if not folder_path:
        print("未選擇資料夾,程式退出。")
        exit()

    # 獲取資料夾中的所有 CSV 檔案路徑
    file_paths = [
        os.path.join(folder_path, f)
        for f in os.listdir(folder_path)
        if f.endswith('.csv')
    ]

    if not file_paths:
        print("資料夾中沒有 CSV 檔案,程式退出。")
        exit()
else:
    print("無效的輸入,程式退出。")
    exit()

# 用戶輸入基準點經緯度
print("請輸入基準點經緯度 (格式: 緯度,經度,例如 24.9943245,121.0774741):")
input_coords = input("基準點經緯度: ")

# 解析用戶輸入
try:
    reference_point = tuple(map(float, input_coords.split(',')))
    if len(reference_point) != 2:
        raise ValueError("輸入格式錯誤!請輸入 '緯度,經度'")
    if not (-90 <= reference_point[0] <= 90) or not (-180 <= reference_point[1] <= 180):
        raise ValueError("基準點緯度範圍必須在 [-90, 90],經度範圍必須在 [-180, 180]")
except Exception as e:
    print(f"輸入有誤: {e}")
    exit()

# 距離計算函數
def calculate_distance(row):
    point = (row['latitude'], row['longitude'])  # 確保緯度在前,經度在後
    return geodesic(reference_point, point).kilometers

# 批次處理
all_data = []
for file_path in file_paths:
    print(f"處理檔案: {file_path}")

    # 使用 Big5 編碼讀取檔案
    try:
        data = pd.read_csv(file_path, encoding='big5')
        print(f"成功使用 Big5 開啟檔案: {file_path}")
    except Exception as e:
        print(f"無法讀取 CSV 檔案,請檢查檔案格式或編碼錯誤: {e}")
        continue

    # 根據檔案類型使用適當的標題
    if '_english' in file_path:
        # 檢查英文標題
        required_columns = ['car_number', 'timestamp', 'latitude', 'longitude']
    else:
        # 檢查原始標題
        required_columns = ['車號', '時間', '經度', '緯度']
    
    if not all(col in data.columns for col in required_columns):
        print(f"CSV 中缺少必要欄位,請確認檔案包含 {required_columns} 欄位。")
        continue

    # 若為原始標題,轉換為英文標題
    if '_english' not in file_path:
        columns_to_select = {
            "車號": "car_number",
            "時間": "timestamp",
            "經度": "latitude",
            "緯度": "longitude"
        }
        data = data[list(columns_to_select.keys())].rename(columns=columns_to_select)

    # 檢查經緯度範圍
    invalid_rows = data[
        (data['latitude'] < -90) | 
        (data['latitude'] > 90) | 
        (data['longitude'] < -180) | 
        (data['longitude'] > 180)
    ]

    if not invalid_rows.empty:
        print(f"檔案 {file_path} 中的經緯度超出有效範圍,請檢查:")
        print(invalid_rows)
        continue

    # 計算距離並儲存結果
    data['distance_km'] = data.apply(calculate_distance, axis=1)

    # 若為原始檔案,儲存英文版本
    if '_english' not in file_path:
        english_file_path = file_path.replace('.csv', '_english.csv')
        data.to_csv(english_file_path, index=False, encoding='utf-8-sig')
        print(f"已儲存英文版本 CSV 至: {english_file_path}")

    all_data.append(data)

# 合併所有處理結果
if all_data:
    merged_data = pd.concat(all_data, ignore_index=True)
    # 依據距離排序
    merged_data_sorted = merged_data.sort_values(by='distance_km', ascending=True)

    # 儲存結果
    if mode == '1':
        output_file = file_path.replace('.csv', '_final_sorted_results.csv')
    else:
        output_file = os.path.join(folder_path, "整合匯出結果_有問題或需更新.csv")
    
    merged_data_sorted.to_csv(output_file, index=False, encoding='utf-8-sig')
    print(f"所有結果已合併並儲存至: {output_file}")
else:
    print("無可用的資料進行合併。")