README.md

export PROJECT_DIR=/path/to/your/directory/for/this/project
mkdir -p ${PROJECT_DIR}

cd ${PROJECT_DIR}
mkdir experiments
cd ${PROJECT_DIR}
git clone https://github.com/ConvLab/ConvLab-3.git ConvLab3
cd ConvLab3
uv sync
git clone TODO CAMELL
cd CAMELL
uv sync
uv run python ../ConvLab3/convlab/dst/setsumbt/run.py \
    --run_config_name setsumbt_multiwoz21 \
    --do_train \
    --do_test \
    --num_train_epochs 0 \
    --output_dir ${PROJECT_DIR}/experiments/seed_ensemble
mv ${PROJECT_DIR}/experiments/seed_ensemble/dataloaders/train.dataloader ${PROJECT_DIR}/experiments/seed_ensemble/dataloaders/train_full.dataloader
cd ${PROJECT_DIR}/CAMELL
uv run active-learning \
    --initialise_active_learning_ensemble \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble \
    --seed 20211202 \
    --seed_size 420
cd ${PROJECT_DIR}/ConvLab3/convlab/dst/setsumbt
for i in {0..4}; do
    uv run python run.py \
        --run_config_name setsumbt_multiwoz21 \
        --do_train \
        --output_dir ${PROJECT_DIR}/experiments/seed_ensemble/ens-$i
done
cd ${PROJECT_DIR}/CAMELL
uv run combine-loaders \
    --ensemble_loaders \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble

uv run python ../ConvLab3/convlab/dst/setsumbt/run.py \
    --run_config_name ensemble_setsumbt_multiwoz21 \
    --do_test \
    --do_eval \
    --do_eval_trainset \
    --output_dir ${PROJECT_DIR}/experiments/seed_ensemble

mv ${PROJECT_DIR}/experiments/seed_ensemble/predictions/train.data ${PROJECT_DIR}/experiments/seed_ensemble/train_labelled.data

uv run active-learning \
    --create_pool_loader \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble

uv run python ../ConvLab3/convlab/dst/setsumbt/run.py \
    --run_config_name ensemble_setsumbt_multiwoz21 \
    --do_eval_trainset \
    --output_dir /path/to/your/model/seed

mv ${PROJECT_DIR}/experiments/seed_ensemble/predictions/train.data ${PROJECT_DIR}/experiments/seed_ensemble/predictions/pool.data
mv ${PROJECT_DIR}/experiments/seed_ensemble/predictions/train_labelled.data ${PROJECT_DIR}/experiments/seed_ensemble/predictions/train.data
cd ${PROJECT_DIR}/CAMELL
uv run confidence-selection --train_confidence_model --prediction_confidence --model_path ${PROJECT_DIR}/experiments/seed_ensemble
cd ${PROJECT_DIR}/CAMELL
uv run confidence-selection \
    --select_from_pool \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble \
    --eval_data_set pool \
    --step_size 420
cd ${PROJECT_DIR}/CAMELL
uv run update-step \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble \
    --ensemble_size 5
cp -r ${PROJECT_DIR}/experiments/seed_ensemble ${PROJECT_DIR}/experiments/step-1
cd ${PROJECT_DIR}/experiments
cp -r seed_ensemble seed_ensemble_noisy

cd ${PROJECT_DIR}/CAMELL
uv run generate-noisy-labels \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble_noisy \
    --ensemble_size 5
cd ${PROJECT_DIR}/ConvLab3/convlab/dst/setsumbt
for i in {0..4}; do
    uv run python run.py \
        --run_config_name setsumbt_multiwoz21 \
        --do_train \
        --output_dir ${PROJECT_DIR}/experiments/seed_ensemble_noisy/ens-$i
done
cd ${PROJECT_DIR}/CAMELL
uv run combine-loaders \
    --ensemble_loaders \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble_noisy

uv run combine-loaders \
    --noisy_loaders \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble
cd ${PROJECT_DIR}/CAMELL
uv run python ../ConvLab3/convlab/dst/setsumbt/run.py \
    --run_config_name ensemble_setsumbt_multiwoz21 \
    --do_test \
    --do_eval \
    --do_eval_trainset \
    --output_dir ${PROJECT_DIR}/experiments/seed_ensemble_noisy

mv ${PROJECT_DIR}/experiments/seed_ensemble_noisy/predictions/train.data ${PROJECT_DIR}/experiments/seed_ensemble_noisy/train_labelled.data

uv run active-learning \
    --create_pool_loader \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble_noisy

uv run python ../ConvLab3/convlab/dst/setsumbt/run.py \
    --run_config_name ensemble_setsumbt_multiwoz21 \
    --do_eval_trainset \
    --output_dir ${PROJECT_DIR}/experiments/seed_ensemble_noisy

mv ${PROJECT_DIR}/experiments/seed_ensemble_noisy/predictions/train.data ${PROJECT_DIR}/experiments/seed_ensemble_noisy/predictions/pool.data
mv ${PROJECT_DIR}/experiments/seed_ensemble_noisy/predictions/train_labelled.data ${PROJECT_DIR}/experiments/seed_ensemble_noisy/predictions/train.data
uv run confidence-selection --train_confidence_model --label_confidence --model_path ${PROJECT_DIR}/experiments/seed_ensemble
cd ${PROJECT_DIR}/CAMELL
uv run confidence-selection \
    --select_for_correction \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble \
    --eval_data_set pool
    --eval_threshold 0.8
cd ${PROJECT_DIR}/CAMELL
uv run active-learning \
    --select_from_pool \
    --acquisition_function random \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble \
    --step_size 420
cd ${PROJECT_DIR}/CAMELL
uv run bald-with-ss \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble \
    --step_size 420
cd ${PROJECT_DIR}/CAMELL
uv run combine-loaders \
    --ensemble_loaders \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble

uv run diversity-al \
    --get_labelled_centroids \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble \
    --encoder_name_or_path "roberta-base"

uv run active-learning \
    --create_pool_loader \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble

uv run diversity-al \
    --select_from_pool \
    --model_path ${PROJECT_DIR}/experiments/seed_ensemble \
    --encoder_name_or_path "roberta-base" \
    --step_size 420
cd ${PROJECT_DIR}/ConvLab3/convlab/dst/setsumbt
uv run python run.py \
    --run_config_name ensemble_setsumbt_multiwoz21 \
    --do_ensemble_setup \
    --output_dir ${PROJECT_DIR}/experiments/full_ensemble
cd ${PROJECT_DIR}/ConvLab3/convlab/dst/setsumbt
for i in {0..4}; do
    uv run python run.py \
        --run_config_name setsumbt_multiwoz21 \
        --do_train \
        --output_dir ${PROJECT_DIR}/experiments/full_ensemble/ens-$i
done
cd ${PROJECT_DIR}/CAMELL

cp -r ${PROJECT_DIR}/experiments/full_ensemble ${PROJECT_DIR}/experiments/full_ensemble_noisy

uv run generate-noisy-labels \
    --model_path ${PROJECT_DIR}/experiments/full_ensemble_noisy \
    --ensemble_size 5
cd ${PROJECT_DIR}/ConvLab3/convlab/dst/setsumbt
for i in {0..4}; do
    uv run python run.py \
        --run_config_name setsumbt_multiwoz21 \
        --do_train \
        --output_dir ${PROJECT_DIR}/experiments/full_ensemble_noisy/ens-$i
done
cd ${PROJECT_DIR}/CAMELL
uv run combine-loaders \
    --ensemble_loaders \
    --model_path ${PROJECT_DIR}/experiments/full_ensemble_noisy

uv run combine-loaders \
    --ensemble_loaders \
    --model_path ${PROJECT_DIR}/experiments/full_ensemble

uv run combine-loaders \
    --noisy_loaders \
    --model_path ${PROJECT_DIR}/experiments/full_ensemble

cd ../ConvLab3/convlab/dst/setsumbt
uv run python run.py \
    --run_config_name ensemble_setsumbt_multiwoz21 \
    --do_eval \
    --do_eval_trainset \
    --output_dir ${PROJECT_DIR}/experiments/full_ensemble_noisy

uv run python run.py \
    --run_config_name ensemble_setsumbt_multiwoz21 \
    --do_eval \
    --do_eval_trainset \
    --output_dir ${PROJECT_DIR}/experiments/full_ensemble
cd ${PROJECT_DIR}/CAMELL
uv run confidence-selection --train_confidence_model --label_confidence --model_path ${PROJECT_DIR}/experiments/full_ensemble
cd ${PROJECT_DIR}/CAMELL
uv run confidence-selection \
    --select_for_correction \
    --model_path ${PROJECT_DIR}/experiments/full_ensemble \
    --eval_data_set train \
    --eval_threshold 0.8
cd ${PROJECT_DIR}/CAMELL
uv run label-correction \
    --correct_labels \
    --model_path ${PROJECT_DIR}/experiments/full_ensemble