import os class Config: # 基座模型 MODEL_NAME = "Qwen/Qwen3-0.6B" # 数据集 DATASET_NAME = "krisfu/delicate_medical_r1_data" # 数据集主题(子数据集) DATASET_SUBJECT = "default" # 数据集用途 DATASET_SPLIT = "train" # 是否使用缓存 DATASET_USE_CACHE = True # swanlab项目名称 SWANLAB_PROJECT = "qweb3-sft-medical-10-11-1" # 验证用system的提示词 PROMPT = "你是一个医学专家,你需要根据用户的问题,给出带有思考的回答。" DATA_MAX_LENGTH = 2048 class Default: DATASET_PATH = os.getenv("DATASET_PATH", "./dataset") # 支持环境变量覆 MODEL_DATASET_PATH = os.getenv("MODEL_DATASET_PATH", "./model_dataset") # 支持环境变量覆 SAVE_DIR = "./saved_model" # 微调后模型存储位置 TRAIN_DATASET_FILE = "train.jsonl" TEST_DATASET_FILE = "val.jsonl" TRAIN_JSONL_NEW_FILE = "train_format.jsonl" TEST_JSONL_NEW_FILE = "val_format.jsonl" dataset_short_name = Config.DATASET_NAME.split("/")[-1] model_dataset_short_name = Config.MODEL_NAME.split("/")[-1] # 确保缓存目录存在 dataset_dir = os.path.normpath( os.path.join(Default.DATASET_PATH, dataset_short_name, Config.DATASET_SUBJECT, Config.DATASET_SPLIT) ) model_dataset_DIR = os.path.normpath( os.path.join(Default.MODEL_DATASET_PATH, model_dataset_short_name, Config.DATASET_SUBJECT, Config.DATASET_SPLIT) ) model_dir = os.path.normpath( os.path.join(Default.SAVE_DIR,model_dataset_short_name, dataset_short_name, Config.DATASET_SUBJECT, Config.DATASET_SPLIT) ) os.makedirs(dataset_dir, exist_ok=True) os.makedirs(model_dataset_DIR, exist_ok=True) os.makedirs(model_dir, exist_ok=True) class Dir: DATASET_DIR = dataset_dir MODEL_DIR = model_dir MODEL_DATASET_DIR = model_dataset_DIR