import os
import pandas as pd
from geopy.distance import geodesic
from tkinter import Tk
from tkinter.filedialog import askopenfilename, askdirectory
# 創建文件選取視窗
Tk().withdraw() # 隱藏主視窗
print("請選擇處理模式:1. 單一檔案 2. 批次處理資料夾")
mode = input("輸入模式代碼 (1 或 2): ")
if mode == '1':
print("請選擇原始 CSV 檔案...")
file_path = askopenfilename(filetypes=[("CSV files", "*.csv")])
if not file_path:
print("未選擇檔案,程式退出。")
exit()
file_paths = [file_path] # 將單一檔案放入列表,統一處理流程
elif mode == '2':
print("請選擇包含 CSV 檔案的資料夾...")
folder_path = askdirectory()
if not folder_path:
print("未選擇資料夾,程式退出。")
exit()
# 獲取資料夾中的所有 CSV 檔案路徑
file_paths = [
os.path.join(folder_path, f)
for f in os.listdir(folder_path)
if f.endswith('.csv')
]
if not file_paths:
print("資料夾中沒有 CSV 檔案,程式退出。")
exit()
else:
print("無效的輸入,程式退出。")
exit()
# 用戶輸入基準點經緯度
print("請輸入基準點經緯度 (格式: 緯度,經度,例如 24.9943245,121.0774741):")
input_coords = input("基準點經緯度: ")
# 解析用戶輸入
try:
reference_point = tuple(map(float, input_coords.split(',')))
if len(reference_point) != 2:
raise ValueError("輸入格式錯誤!請輸入 '緯度,經度'")
if not (-90 <= reference_point[0] <= 90) or not (-180 <= reference_point[1] <= 180):
raise ValueError("基準點緯度範圍必須在 [-90, 90],經度範圍必須在 [-180, 180]")
except Exception as e:
print(f"輸入有誤: {e}")
exit()
# 距離計算函數
def calculate_distance(row):
point = (row['latitude'], row['longitude']) # 確保緯度在前,經度在後
return geodesic(reference_point, point).kilometers
# 批次處理
all_data = []
for file_path in file_paths:
print(f"處理檔案: {file_path}")
# 使用 Big5 編碼讀取檔案
try:
data = pd.read_csv(file_path, encoding='big5')
print(f"成功使用 Big5 開啟檔案: {file_path}")
except Exception as e:
print(f"無法讀取 CSV 檔案,請檢查檔案格式或編碼錯誤: {e}")
continue
# 根據檔案類型使用適當的標題
if '_english' in file_path:
# 檢查英文標題
required_columns = ['car_number', 'timestamp', 'latitude', 'longitude']
else:
# 檢查原始標題
required_columns = ['車號', '時間', '經度', '緯度']
if not all(col in data.columns for col in required_columns):
print(f"CSV 中缺少必要欄位,請確認檔案包含 {required_columns} 欄位。")
continue
# 若為原始標題,轉換為英文標題
if '_english' not in file_path:
columns_to_select = {
"車號": "car_number",
"時間": "timestamp",
"經度": "latitude",
"緯度": "longitude"
}
data = data[list(columns_to_select.keys())].rename(columns=columns_to_select)
# 檢查經緯度範圍
invalid_rows = data[
(data['latitude'] < -90) |
(data['latitude'] > 90) |
(data['longitude'] < -180) |
(data['longitude'] > 180)
]
if not invalid_rows.empty:
print(f"檔案 {file_path} 中的經緯度超出有效範圍,請檢查:")
print(invalid_rows)
continue
# 計算距離並儲存結果
data['distance_km'] = data.apply(calculate_distance, axis=1)
# 若為原始檔案,儲存英文版本
if '_english' not in file_path:
english_file_path = file_path.replace('.csv', '_english.csv')
data.to_csv(english_file_path, index=False, encoding='utf-8-sig')
print(f"已儲存英文版本 CSV 至: {english_file_path}")
all_data.append(data)
# 合併所有處理結果
if all_data:
merged_data = pd.concat(all_data, ignore_index=True)
# 依據距離排序
merged_data_sorted = merged_data.sort_values(by='distance_km', ascending=True)
# 儲存結果
if mode == '1':
output_file = file_path.replace('.csv', '_final_sorted_results.csv')
else:
output_file = os.path.join(folder_path, "整合匯出結果_有問題或需更新.csv")
merged_data_sorted.to_csv(output_file, index=False, encoding='utf-8-sig')
print(f"所有結果已合併並儲存至: {output_file}")
else:
print("無可用的資料進行合併。")