# -*- coding: utf-8 -*-
"""
Step5 后端计算服务（数据清洗）
====================================

纯计算函数——绝对不引用 PyQt、绝对不引用 main_view、绝对不读写全局变量。它只：

1. 从 ``config`` 字典读取参数；
2. 调用旧版 ``DataPreparationStep.process_csv`` 读取水质 CSV，
   筛选剔除异常值后写出新的 CSV；
3. 返回结果字典 ``{status, output_path, message, mode}``。

调用入口（由 main_view 在后台 QThread 中调用）：

    execute_step5({
        "csv_path": "D:/water_quality.csv",          # 输入水质参数 CSV
        "enabled": True,
        "output_path": "D:/processed_data.csv",      # 处理后输出 CSV
        "work_dir": "D:/workspace",                  # 工作目录（main_view 注入）
    })

返回字典字段：

* ``status``       : "completed" | "skipped" | "error"
* ``output_path``  : 生成的 .csv 清洗后文件路径（失败时为 None）
* ``message``      : 人类可读说明
* ``mode``         : "csv_clean"（便于 UI 提示）
"""

from __future__ import annotations

from pathlib import Path
from typing import Any, Dict

from src.core.steps.data_preparation_step import DataPreparationStep
from src.new.services._output_resolver import (
    copy_to_user_path,
    get_user_output_path,
    is_user_specified,
    resolve_output_dir,
)


def _resolve_output_dir(config: Dict[str, Any], work_dir: str) -> tuple[Path, str]:
    """根据 output_path / work_dir 计算清洗后 CSV 输出目录

    使用共享解析器强制执行"用户优先"规则——用户指定 output_path 时用其父目录，
    否则用 work_dir/5_Data_Cleaning 默认。
    """
    return resolve_output_dir(config, work_dir, "5_Data_Cleaning", "output_path", "output_dir")


def execute_step5(config: Dict[str, Any]) -> Dict[str, Any]:
    """Step 5 后端计算入口——纯函数

    Args:
        config: 由前端 view.get_config() 序列化、再经 main_view 注入 work_dir 的字典

    Returns:
        标准结果字典 ``{status, output_path, message, mode}``
    """
    # ---------- 入参规整 ----------
    csv_path = config.get("csv_path")
    enabled = bool(config.get("enabled", True))
    output_path = config.get("output_path")
    work_dir = config.get("work_dir") or "."

    output_dir, _source = _resolve_output_dir(config, work_dir)
    mode = "csv_clean"

    # ---------- 提前失败检查 ----------
    if not enabled:
        return {
            "status": "skipped",
            "output_path": None,
            "message": "用户禁用此步骤（enabled=False）",
            "mode": mode,
        }
    if not csv_path:
        return {
            "status": "error",
            "output_path": None,
            "message": "未提供水质参数 CSV 路径（csv_path）",
            "mode": mode,
        }
    if not Path(csv_path).exists():
        return {
            "status": "error",
            "output_path": None,
            "message": f"水质参数 CSV 不存在: {csv_path}",
            "mode": mode,
        }

    # ---------- 显式构造 output_path（如未指定）----------
    # process_csv 内部会用 output_dir/processed_data.csv 自行拼接，
    # 此处显式指定 output_path 以保持契约一致。
    if not output_path:
        output_path = str(output_dir / "processed_data.csv").replace("\\", "/")

    # ---------- 执行（包一层 try/except 把异常转 dict，避免炸线程） ----------
    try:
        result_path = DataPreparationStep.process_csv(
            csv_path=csv_path,
            output_dir=output_dir,
            callback=None,  # 日志由 main_view 统一接管
        )
    except FileNotFoundError as e:
        return {
            "status": "error",
            "output_path": None,
            "message": f"文件不存在: {e}",
            "mode": mode,
        }
    except ValueError as e:
        return {
            "status": "error",
            "output_path": None,
            "message": f"参数错误: {e}",
            "mode": mode,
        }
    except Exception as e:  # noqa: BLE001 —— service 层兜底捕获所有
        return {
            "status": "error",
            "output_path": None,
            "message": f"{type(e).__name__}: {e}",
            "mode": mode,
        }

    # ---------- 成功路径 ----------
    p = Path(result_path)
    if not p.exists():
        return {
            "status": "error",
            "output_path": None,
            "message": f"DataPreparationStep.process_csv 未生成文件: {result_path}",
            "mode": mode,
        }

    # ---------- 事后劫持：用户指定文件名 vs 底层硬编码文件名 ----------
    # process_csv 内部硬编码输出文件名 processed_data.csv，
    # 用户浏览指定的文件名（无论是 .csv 还是别的格式）被底层忽略。
    user_path = config.get("output_path")
    if user_path:
        result_path = copy_to_user_path(result_path, user_path)
        p = Path(result_path)

    return {
        "status": "completed",
        "output_path": str(p).replace("\\", "/"),
        "message": f"清洗后 CSV 已保存: {p.name}",
        "mode": mode,
    }