3DGen
/

3dgen-score-mvclip-v1

Model card Files Files and versions Community

3dgen-score-mvclip-v1 / config.yaml

ZhangYuhan

Upload config.yaml

94f0dfc verified 4 months ago

raw

history blame contribute delete

5.81 kB

	accelerator:
	_target_: trainer.accelerators.deepspeed_accelerator.DeepSpeedAccelerator
	output_dir: outputs/Multi-CLIP_ViT_H_14-clean/from_con_image/stage2_eval_from_latest
	mixed_precision: BF16
	gradient_accumulation_steps: 1
	log_with: WANDB
	debug:
	activate: false
	port: 5900
	seed: 42
	resume_from_latest: true
	resume_from_name_or_path: outputs/Multi-CLIP_ViT_H_14-clean/from_con_image/stage1_neg/checkpoint-latest
	train_from_scratch: true
	max_steps: 4000
	num_epochs: 10
	validate_steps: 100
	eval_on_start: true
	project_name: Multi-CLIP_ViT_H_14-clean
	max_grad_norm: 1.0
	save_steps: 100
	metric_name: loss
	metric_mode: MIN
	limit_num_checkpoints: 3
	save_only_if_best: true
	dynamo_backend: 'NO'
	keep_best_ckpts: true
	deepspeed:
	fp16:
	enabled: false
	bf16:
	enabled: true
	optimizer:
	type: AdamW
	params:
	lr: auto
	weight_decay: auto
	torch_adam: true
	adam_w_mode: true
	scheduler:
	type: WarmupDecayLR
	params:
	warmup_min_lr: auto
	warmup_max_lr: auto
	warmup_num_steps: auto
	total_num_steps: auto
	zero_optimization:
	stage: 2
	allgather_partitions: true
	allgather_bucket_size: 200000000.0
	overlap_comm: true
	reduce_scatter: true
	reduce_bucket_size: 500000000
	contiguous_gradients: true
	gradient_accumulation_steps: 16
	gradient_clipping: 1.0
	steps_per_print: 1
	train_batch_size: auto
	train_micro_batch_size_per_gpu: auto
	wall_clock_breakdown: false
	deepspeed_final:
	fp16:
	enabled: false
	bf16:
	enabled: true
	optimizer:
	type: AdamW
	params:
	lr: auto
	weight_decay: auto
	torch_adam: true
	adam_w_mode: true
	scheduler:
	type: WarmupDecayLR
	params:
	warmup_min_lr: auto
	warmup_max_lr: auto
	warmup_num_steps: auto
	total_num_steps: auto
	zero_optimization:
	stage: 2
	allgather_partitions: true
	allgather_bucket_size: 200000000.0
	overlap_comm: true
	reduce_scatter: true
	reduce_bucket_size: 500000000
	contiguous_gradients: true
	gradient_accumulation_steps: 16
	gradient_clipping: 1.0
	steps_per_print: .inf
	train_batch_size: auto
	train_micro_batch_size_per_gpu: auto
	wall_clock_breakdown: false
	task:
	limit_examples_to_wandb: 50
	_target_: trainer.tasks.mvclip_task.MVCLIPTask
	pretrained_clip_model_name_or_path: laion/CLIP-ViT-H-14-laion2B-s32B-b79K
	label_0_column_name: label_0
	label_1_column_name: label_1
	reference_type_column_name: reference_type
	reference_input_column_name: reference_input
	reference_idx_column_name: reference_idx
	normal_pixels_0_column_name: normal_pixel_values_0
	normal_pixels_1_column_name: normal_pixel_values_1
	rgb_pixels_0_column_name: rgb_pixel_values_0
	rgb_pixels_1_column_name: rgb_pixel_values_1
	model:
	_target_: trainer.models.mvclip_model.MVCLIPModel
	pretrained_clip_model_name_or_path: laion/CLIP-ViT-H-14-laion2B-s32B-b79K
	freeze_clip: true
	freeze_vision: false
	freeze_logit_scale: false
	freeze_logit_proj: false
	criterion:
	_target_: trainer.criterions.criterion.MVCriterion
	is_distributed: true
	reference_type_column_name: reference_type
	reference_input_column_name: reference_input
	label_0_column_name: label_0
	label_1_column_name: label_1
	normal_pixels_0_column_name: normal_pixel_values_0
	normal_pixels_1_column_name: normal_pixel_values_1
	rgb_pixels_0_column_name: rgb_pixel_values_0
	rgb_pixels_1_column_name: rgb_pixel_values_1
	num_examples_per_prompt_column_name: num_example_per_prompt
	in_batch_negatives: false
	dataset:
	train_split_name: train_valid
	valid_split_name: valid
	test_split_name: test
	batch_size: 16
	num_workers: 2
	drop_last: true
	_target_: trainer.datasetss.dataset.MVDataset
	records_dir: /mnt/petrelfs/zhangyuhan/data/evaluation/records/battle/clean/splits
	gallery_dir: /mnt/petrelfs/zhangyuhan/data/evaluation/gallery510
	text_gallery_path: /mnt/petrelfs/zhangyuhan/data/evaluation/gallery510/prompts_510.json
	image_gallery_dir: /mnt/petrelfs/zhangyuhan/data/evaluation/gallery510/rgba
	con_images_dir: /mnt/petrelfs/zhangyuhan/data/evaluation/con_images
	split_con_image: false
	cache_dir: null
	reference_type_column_name: reference_type
	reference_idx_column_name: reference_idx
	reference_column_name: reference
	normal_image_0_column_name: normal_image_0
	normal_image_1_column_name: normal_image_1
	rgb_image_0_column_name: rgb_image_0
	rgb_image_1_column_name: rgb_image_1
	eval_dims_column_name: eval_dims
	label_0_column_name: label_0
	label_1_column_name: label_1
	are_different_column_name: are_different
	has_label_column_name: has_label
	reference_input_column_name: reference_input
	normal_pixels_0_column_name: normal_pixel_values_0
	normal_pixels_1_column_name: normal_pixel_values_1
	rgb_pixels_0_column_name: rgb_pixel_values_0
	rgb_pixels_1_column_name: rgb_pixel_values_1
	num_examples_per_prompt_column_name: num_example_per_prompt
	shuffle: true
	keep_only_different: false
	keep_only_with_label: false
	keep_only_with_label_in_non_train: true
	processor:
	_target_: transformers.AutoProcessor.from_pretrained
	pretrained_model_name_or_path: laion/CLIP-ViT-H-14-laion2B-s32B-b79K
	limit_examples_per_prompt: -1
	only_on_best: false
	optimizer:
	_target_: trainer.optimizers.dummy_optimizer.BaseDummyOptim
	lr: 3.0e-06
	weight_decay: 0.3
	lr_scheduler:
	_target_: trainer.lr_schedulers.dummy_lr_scheduler.instantiate_dummy_lr_scheduler
	lr: 3.0e-06
	lr_warmup_steps: 500
	total_num_steps: 4000
	debug:
	activate: false
	port: 5900
	output_dir: outputs/Multi-CLIP_ViT_H_14-clean/from_con_image/stage2_eval_from_latest