Spaces:

ICCV2023
/

ICCV2023-papers

Running

App Files Files Community

hysts HF staff commited on Sep 15, 2023

Commit

9d478aa

•

1 Parent(s): fb827e9

commit files to HF hub

Browse files

Files changed (1) hide show

papers.csv +7 -7

papers.csv CHANGED Viewed

@@ -358,7 +358,7 @@ Hiding Visual Information via Obfuscating Adversarial Perturbations,"Su, Zhigang
 An Embarrassingly Simple Self-supervised Trojan Attack,"Li, Changjiang *; Ren, Pang; Xi, Zhaohan; Du, Tianyu; Ji, Shouling; Wang, Ting; Yao, Yuan",poster,,,,,,,,,
 Efficient Decision-based Black-box Patch Attacks on Video Recognition ,"Jiang, Kaixun*; Chen, Zhaoyu; Huang, Hao; Wang, Jiafeng; Yang, Dingkang; Li, Bo; Wang, Yan; Zhang, Wenqiang",poster,,,,,,,,,
 Adversarial Finetuning with Latent Representation Constraint to Mitigate Accuracy-Robustness Tradeoff,"Suzuki, Satoshi*; Yamaguchi, Shin'ya; Takeda, Shoichiro; Kanai, Sekitoshi; makishima, naoki; Ando, Atsushi; Masumura, Ryo",poster,2308.16454,https://arxiv.org/abs/2308.16454,,https://huggingface.co/papers/2308.16454,,,,7,0
-Towards Building More Robust Models with Frequency Bias,"Bu, Qingwen*; HUANG, Dong; Cui, Heming ",poster,2307.09763,https://arxiv.org/abs/2307.09763,,https://huggingface.co/papers/2307.09763,,,,3,0
 System-Driven Adversarial Object Evasion Attack in Autonomous Driving,"Wang, Ningfei*; Luo, Yunpeng; SATO, TAKAMI; Xu, Kaidi; Chen, Alfred",poster,,,,,,,,,
 Improving Generalization of Adversarial Training via Robust Critical Fine-Tuning,"Zhu, Kaijie*; Hu, Xixu; Wang, Jindong; Xie, Xing; Yang, Ge",poster,2308.02533,https://arxiv.org/abs/2308.02533,https://github.com/microsoft/robustlearn,https://huggingface.co/papers/2308.02533,,,,5,0
 Enhancing Generalization of Universal Adversarial Perturbation through Gradient Aggregation,"Liu, Xuannan; Zhong, Yaoyao; Zhang, Yuhang; Qin, lixiong; Deng, Weihong*",poster,2308.06015,https://arxiv.org/abs/2308.06015,https://github.com/liuxuannan/Stochastic-Gradient-Aggregation,https://huggingface.co/papers/2308.06015,,,,5,0
@@ -575,7 +575,7 @@ FeatEnHancer: Enhancing Hierarchical Features for Object Detection and Beyond Un
 DetZero: Rethinking Offboard 3D Object Detection with Long-term Sequential Point Clouds,"Ma, Tao*; Yang, Xuemeng; Zhou, Hongbin; Li, Xin; Shi, Botian; Liu, Junjie; Yang, Yuchen; Liu, Zhizheng; He, Liang; Li, Hongsheng; Li, Yikang; Qiao, Yu",poster,2306.06023,https://arxiv.org/abs/2306.06023,,https://huggingface.co/papers/2306.06023,,,,12,0
 DETRs with Collaborative Hybrid Assignments Training,"Zong, Zhuofan*; Song, Guanglu; Liu, Yu",poster,2211.12860,https://arxiv.org/abs/2211.12860,https://github.com/Sense-X/Co-DETR,https://huggingface.co/papers/2211.12860,,,,3,0
 Open Vocabulary Object Detection With an Open Corpus,"Wang, Jiong*; zhang, huiming; Hong, Haiwen; Jin, Xuan; He, Yuan; xue, hui; Zhao, Zhou",poster,,,,,,,,,
-SparseDet: Improving Sparsely Annotated Object Detection with Pseudo-positive Mining,"Suri, Saksham*; Rambhatla, Sai Saketh ; Chellappa, Rama; Shrivastava, Abhinav",poster,2201.04620,https://arxiv.org/abs/2201.04620,,https://huggingface.co/papers/2201.04620,,,,4,0
 Unsupervised Anomaly Detection with Diffusion Probabilistic Model,"Zhang, Xinyi*; Li, Naiqi; Li, Jiawei; Dai, Tao; Jiang, Yong; Xia, Shu-Tao",poster,,,,,,,,,
 UniTR: A Unified and Efficient Multi-Modal Transformer for Bird's-Eye-View Representation,"Wang, Haiyang*; Tang, Hao; Shi, Shaoshuai; Li, Aoxue; Li, Zhenguo; Schiele, Bernt; Wang, Liwei",poster,,,,,,,,,
 Focus the Discrepancy: Intra- and Inter-Correlation Learning for Image Anomaly Detection,"Yao, Xincheng*; Li, Ruoqi; Qian, Zefeng; Luo, Yan; Zhang, Chongyang",poster,,,,,,,,,
@@ -1195,7 +1195,7 @@ ENeRF: Event-enhanced Neural Radiance Fields from Blurry Images,"Qi, Yunshan*; Z
 Iterative Denoiser and Noise Estimator for Self-supervised Image Denoising,"Zou, Yunhao; Yan, Chenggang; Fu, Ying*",poster,,,,,,,,,
 Lighting Every Darkness in Two Pairs: A Calibration-Free Pipeline for RAW Denoising,"Jin, Xin; Xiao, Jia-wen Schuyler; Han, Ling-Hao; Guo, Chun-Le*; Zhang, Ruixun; Liu, Xialei; Li, Chongyi",poster,2308.03448,https://arxiv.org/abs/2308.03448,https://github.com/Srameo/LED,https://huggingface.co/papers/2308.03448,,,,7,0
 Fingerprinting Deep Image Restoration Models,"Quan, Yuhui; Teng, Huan; Xu, Ruotao*; Huang, Jun; Ji, Hui",poster,,,,,,,,,
-Environment-Invariant Curriculum Relation Learning for Fine-Grained Scene Graph Generation,"Min, Yukuan; Wu, Aming; Deng, Cheng*",poster,2308.03282,https://arxiv.org/abs/2308.03282,,https://huggingface.co/papers/2308.03282,,,,3,0
 DCPB: Deformable Convolution based on the Poincare Ball for Top-view Fisheye Cameras,"Wei, Xuan; Ran, Zhidan; Lu, Xiaobo*",poster,,,,,,,,,
 FemtoDet: An Object Detection Baseline for Energy Versus Performance Tradeoffs,"Tu, Peng*; Xie, Xu; AI, GUO; Li, Yuexiang; Huang, Yawen; Zheng, Yefeng",poster,2301.06719,https://arxiv.org/abs/2301.06719,,https://huggingface.co/papers/2301.06719,,,,6,0
 Curvature-Aware Training for Coordinate Networks,"Saratchandran, Hemanth*; Chng, Shin-Fang; Ramasinghe, Sameera; MacDonald, Lachlan; Lucey, Simon",poster,2305.08552,https://arxiv.org/abs/2305.08552,,https://huggingface.co/papers/2305.08552,,,,5,0
@@ -1378,7 +1378,7 @@ VLSlice: Interactive Vision-and-Language Slice Discovery,"Slyman, Eric*; Kahng,
 Pretrained Language Models as Visual Planners for Human Assistance,"Patel, Dhruvesh; Eghbalzadeh, Hamid; Kamra, Nitin; Iuzzolino, Michael; Jain, Unnat; Desai, Ruta P*",poster,2304.09179,https://arxiv.org/abs/2304.09179,,https://huggingface.co/papers/2304.09179,,,,6,0
 VQA Therapy: Exploring Answer Differences by Visually Grounding Answers,"Chen, Chongyan*; Anjum, Samreen; Gurari, Danna",poster,2308.11662,https://arxiv.org/abs/2308.11662,,https://huggingface.co/papers/2308.11662,,,,3,0
 Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using only Images,"Yu, Cuican*; Lu, Guansong; Zeng, Yihan; Sun, Jian; Liang, Xiaodan; Li, Huibin; Xu, Zongben; Xu, Songcen; Zhang, Wei; Xu, Hang",poster,2308.16758,https://arxiv.org/abs/2308.16758,,https://huggingface.co/papers/2308.16758,,,,10,0
-Zero-Shot Composed Image Retrieval with Textual Inversion,"Baldrati, Alberto*; Agnolucci, Lorenzo; Bertini, Marco; Del Bimbo, Alberto",poster,2303.15247,https://arxiv.org/abs/2303.15247,https://github.com/miccunifi/SEARLE,https://huggingface.co/papers/2303.15247,,,,4,0
 PatchCT: Aligning Patch Set and Label Set with Conditional Transport for Multi-Label Image Classification,"Wang, Dongsheng*; Li, Miaoge; Liu, Xinyang; Zeng, Zequn; Lu, Ruiying; Chen, Bo; Zhou, Mingyuan",poster,2307.09066,https://arxiv.org/abs/2307.09066,,https://huggingface.co/papers/2307.09066,,,,7,0
 Lip Reading for Low-resource Languages by Learning and Combining General Speech Knowledge and Language-specific Knowledge,"Kim, Minsu*; Yeo, Jeong Hun; Choi, Jeongsoo; Ro, Yong Man",poster,2308.09311,https://arxiv.org/abs/2308.09311,,https://huggingface.co/papers/2308.09311,,,,4,0
 ViewRefer: Grasp the Multi-view Knowledge for 3D Visual Grounding,"Guo, Ziyu*; Tang, Yiwen; Zhang, Renrui; Wang, Dong; Wang, Zhigang; Zhao, Bin; Li, Xuelong",poster,,,,,,,,,
@@ -1528,7 +1528,7 @@ Achievement-based Training Progress Balancing for Multi-Task Learning,"YUN, hayo
 Prune Spatio-temporal Tokens by Semantic-aware Temporal Accumulation,"Ding, Shuangrui*; Zhao, Peisen; zhang, xiaopeng; Qian, Rui; Xiong, Hongkai; Tian, Qi",poster,2308.04549,https://arxiv.org/abs/2308.04549,https://github.com/Mark12Ding/STA,https://huggingface.co/papers/2308.04549,,,,6,0
 Differentiable Transportation Pruning,"Li, Yunqiang*; van Gemert, Jan C; Hoefler, Torsten; Moons, Bert; Eleftheriou, Evangelos; Verhoef, Bram-Ernst",poster,2307.08483,https://arxiv.org/abs/2307.08483,,https://huggingface.co/papers/2307.08483,,,,6,0
 XiNet: Efficient Neural Networks for tinyML,"Ancilotto, Alberto*; Paissan, Francesco; Farella, Elisabetta",poster,,,,,,,,,
-Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers,"Frumkin, Natalia*; Gope, Dibakar; Marculescu, Diana",poster,2308.10814,https://arxiv.org/abs/2308.10814,https://github.com/enyac-group/evol-q,https://huggingface.co/papers/2308.10814,,,,3,0
 A2Q: Accumulator-Aware Quantization with Guaranteed Overflow Avoidance,"Colbert, Ian*; Pappalardo, Alessandro; Petri-Koenig, Jakoba",poster,2308.13504,https://arxiv.org/abs/2308.13504,,https://huggingface.co/papers/2308.13504,,,,3,0
 Workie-Talkie: Accelerating Federated Learning by Overlapping Computing and Communications via Contrastive Regularization,"Chen, Rui*; Wan, Qiyu ; Prakash, Pavana; Zhang, Lan; Yuan, Xu; Gong, Yanmin; Fu, Xin; Pan, Miao",poster,,,,,,,,,
 DenseShift: Towards Accurate and Transferable Low-Bit Shift Network,"Li, Xinlin*; Liu, Bang; Yang, Rui Heng; Courville, Vanessa; Xing, Chao; Partovi Nia, Vahid",poster,2208.09708,https://arxiv.org/abs/2208.09708,,https://huggingface.co/papers/2208.09708,,,,6,0
@@ -1979,7 +1979,7 @@ Shape Anchor Guided Holistic Indoor Scene Understanding,"Dong, Mingyue; Huan, Li
 SGAligner: 3D Scene Alignment with Scene Graphs,"Deb Sarkar, Sayan*; Miksik, Ondrej; Pollefeys, Marc; Barath, Daniel; Armeni, Iro",poster,,,,,,,,,
 Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation,"Wu, Jianzong; Li, Xiangtai*; Ding, Henghui; Li, Xia; Cheng, Guangliang; Tong, Yunhai; Loy, Chen Change",poster,2301.00805,https://arxiv.org/abs/2301.00805,,https://huggingface.co/papers/2301.00805,,,,7,0
 SLAN: Self-Locator Aided Network for Vision-language Understanding,"Zhai, Jiang-Tian*; Zhang, Qi; Wu, Tong; Chen, Xingyu; Liu, Jiang-Jiang; Cheng, Ming-Ming",poster,,,,,,,,,
-Task-Oriented Multi-Modal Mutual Leaning for Vision-Language Models,"Long, Sifan*; Zhao, Zhen; Yuan, Junkun; Tan, Zichang; Liu, Jiang-Jiang; Zhou, Luping; Wang, Shengsheng; Wang, Jingdong",poster,2303.17169,https://arxiv.org/abs/2303.17169,,https://huggingface.co/papers/2303.17169,,,,8,0
 TinyCLIP: CLIP Distillation via Affinity Mimicking and Weight Inheritance,"Wu, Kan*; Peng, Houwen; Zhou, Zhenghong; Xiao, Bin; Liu, Mengchen; Yuan, Lu; Xuan, Hong; Valenzuela, Michael L; Chen, Xi; Chao, Hongyang; Wang, Xinggang; Hu, Han",poster,,,,,,,,,
 In-Style: Unsupervised Text-Video Retrieval with Style Preservation,"Shvetsova, Nina*; Kukleva, Anna; Schiele, Bernt; Kuehne, Hilde",poster,,,,,,,,,
 Preserving Modality Structure Improves Multi-Modal Learning ,"Swetha, Sirnam*; Rizve, Mamshad Nayeem; Shvetsova, Nina; Kuehne, Hilde; Shah, Mubarak",poster,,,,,,,,,
@@ -2112,7 +2112,7 @@ UpCycling: Semi-supervised 3D Object Detection without Sharing Raw-level Unlabel
 Graph Matching with Bi-level Noisy Correspondence,"Lin, Yijie; Yang, Mouxing; Yu, Jun; Hu, Peng; Zhang, Changqing; Peng, Xi*",poster,2212.04085,https://arxiv.org/abs/2212.04085,https://github.com/XLearning-SCU/2023-ICCV-COMMON,https://huggingface.co/papers/2212.04085,,,,6,0
 Anomaly Detection using Score-based Perturbation Resilience,"Shin, Woosang*; Lee, Jong-Hyeon; Lee, Taehan; Lee, Sangmoon; Yun, Jong Pil",poster,,,,,,,,,
 Spatio-Temporal Domain Awareness for Multi-Agent Collaborative Perception,"yang, kun*; Yang, Dingkang; Zhang, Jingyu; Li, Mingcheng; Liu, Yang; Liu, Jing; Wang, Hanqi; Sun, Peng; Song, Liang ",poster,2307.13929,https://arxiv.org/abs/2307.13929,,https://huggingface.co/papers/2307.13929,,,,9,0
-Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing,"Baldrati, Alberto; Morelli, Davide*; Cartella, Giuseppe; Cornia, Marcella; Bertini, Marco; Cucchiara, Rita",poster,2304.02051,https://arxiv.org/abs/2304.02051,https://github.com/aimagelab/multimodal-garment-designer,https://huggingface.co/papers/2304.02051,,,,6,0
 Towards Unifying Medical Vision-and-Language Pre-training via Soft Prompts,"Chen, Zhihong; Diao, Shizhe; wang, benyou; Li, Guanbin*; Wan, Xiang",poster,2302.08958,https://arxiv.org/abs/2302.08958,,https://huggingface.co/papers/2302.08958,,,,5,0
 MAS: Towards Resource-Efficient Federated Multiple-Task Learning,"Zhuang, Weiming*; Wen, Yonggang; Lyu, Lingjuan; zhang, shuai",poster,2307.11285,https://arxiv.org/abs/2307.11285,,https://huggingface.co/papers/2307.11285,,,,4,0
 Hierarchical Visual Categories Modeling in A Probabilistic Perspective for Out-of-Distribution Detection ,"Li, Jinglun; Zhou, Xinyu; Guo, Pinxue; Sun, Yixuan; Huang, Yiwen; Ge, Weifeng*; Zhang, Wenqiang",poster,,,,,,,,,

 An Embarrassingly Simple Self-supervised Trojan Attack,"Li, Changjiang *; Ren, Pang; Xi, Zhaohan; Du, Tianyu; Ji, Shouling; Wang, Ting; Yao, Yuan",poster,,,,,,,,,
 Efficient Decision-based Black-box Patch Attacks on Video Recognition ,"Jiang, Kaixun*; Chen, Zhaoyu; Huang, Hao; Wang, Jiafeng; Yang, Dingkang; Li, Bo; Wang, Yan; Zhang, Wenqiang",poster,,,,,,,,,
 Adversarial Finetuning with Latent Representation Constraint to Mitigate Accuracy-Robustness Tradeoff,"Suzuki, Satoshi*; Yamaguchi, Shin'ya; Takeda, Shoichiro; Kanai, Sekitoshi; makishima, naoki; Ando, Atsushi; Masumura, Ryo",poster,2308.16454,https://arxiv.org/abs/2308.16454,,https://huggingface.co/papers/2308.16454,,,,7,0
+Towards Building More Robust Models with Frequency Bias,"Bu, Qingwen*; HUANG, Dong; Cui, Heming ",poster,2307.09763,https://arxiv.org/abs/2307.09763,,https://huggingface.co/papers/2307.09763,,,,3,1
 System-Driven Adversarial Object Evasion Attack in Autonomous Driving,"Wang, Ningfei*; Luo, Yunpeng; SATO, TAKAMI; Xu, Kaidi; Chen, Alfred",poster,,,,,,,,,
 Improving Generalization of Adversarial Training via Robust Critical Fine-Tuning,"Zhu, Kaijie*; Hu, Xixu; Wang, Jindong; Xie, Xing; Yang, Ge",poster,2308.02533,https://arxiv.org/abs/2308.02533,https://github.com/microsoft/robustlearn,https://huggingface.co/papers/2308.02533,,,,5,0
 Enhancing Generalization of Universal Adversarial Perturbation through Gradient Aggregation,"Liu, Xuannan; Zhong, Yaoyao; Zhang, Yuhang; Qin, lixiong; Deng, Weihong*",poster,2308.06015,https://arxiv.org/abs/2308.06015,https://github.com/liuxuannan/Stochastic-Gradient-Aggregation,https://huggingface.co/papers/2308.06015,,,,5,0
 DetZero: Rethinking Offboard 3D Object Detection with Long-term Sequential Point Clouds,"Ma, Tao*; Yang, Xuemeng; Zhou, Hongbin; Li, Xin; Shi, Botian; Liu, Junjie; Yang, Yuchen; Liu, Zhizheng; He, Liang; Li, Hongsheng; Li, Yikang; Qiao, Yu",poster,2306.06023,https://arxiv.org/abs/2306.06023,,https://huggingface.co/papers/2306.06023,,,,12,0
 DETRs with Collaborative Hybrid Assignments Training,"Zong, Zhuofan*; Song, Guanglu; Liu, Yu",poster,2211.12860,https://arxiv.org/abs/2211.12860,https://github.com/Sense-X/Co-DETR,https://huggingface.co/papers/2211.12860,,,,3,0
 Open Vocabulary Object Detection With an Open Corpus,"Wang, Jiong*; zhang, huiming; Hong, Haiwen; Jin, Xuan; He, Yuan; xue, hui; Zhao, Zhou",poster,,,,,,,,,
+SparseDet: Improving Sparsely Annotated Object Detection with Pseudo-positive Mining,"Suri, Saksham*; Rambhatla, Sai Saketh ; Chellappa, Rama; Shrivastava, Abhinav",poster,2201.04620,https://arxiv.org/abs/2201.04620,,https://huggingface.co/papers/2201.04620,,,,4,1
 Unsupervised Anomaly Detection with Diffusion Probabilistic Model,"Zhang, Xinyi*; Li, Naiqi; Li, Jiawei; Dai, Tao; Jiang, Yong; Xia, Shu-Tao",poster,,,,,,,,,
 UniTR: A Unified and Efficient Multi-Modal Transformer for Bird's-Eye-View Representation,"Wang, Haiyang*; Tang, Hao; Shi, Shaoshuai; Li, Aoxue; Li, Zhenguo; Schiele, Bernt; Wang, Liwei",poster,,,,,,,,,
 Focus the Discrepancy: Intra- and Inter-Correlation Learning for Image Anomaly Detection,"Yao, Xincheng*; Li, Ruoqi; Qian, Zefeng; Luo, Yan; Zhang, Chongyang",poster,,,,,,,,,
 Iterative Denoiser and Noise Estimator for Self-supervised Image Denoising,"Zou, Yunhao; Yan, Chenggang; Fu, Ying*",poster,,,,,,,,,
 Lighting Every Darkness in Two Pairs: A Calibration-Free Pipeline for RAW Denoising,"Jin, Xin; Xiao, Jia-wen Schuyler; Han, Ling-Hao; Guo, Chun-Le*; Zhang, Ruixun; Liu, Xialei; Li, Chongyi",poster,2308.03448,https://arxiv.org/abs/2308.03448,https://github.com/Srameo/LED,https://huggingface.co/papers/2308.03448,,,,7,0
 Fingerprinting Deep Image Restoration Models,"Quan, Yuhui; Teng, Huan; Xu, Ruotao*; Huang, Jun; Ji, Hui",poster,,,,,,,,,
+Environment-Invariant Curriculum Relation Learning for Fine-Grained Scene Graph Generation,"Min, Yukuan; Wu, Aming; Deng, Cheng*",poster,2308.03282,https://arxiv.org/abs/2308.03282,,https://huggingface.co/papers/2308.03282,,,,3,1
 DCPB: Deformable Convolution based on the Poincare Ball for Top-view Fisheye Cameras,"Wei, Xuan; Ran, Zhidan; Lu, Xiaobo*",poster,,,,,,,,,
 FemtoDet: An Object Detection Baseline for Energy Versus Performance Tradeoffs,"Tu, Peng*; Xie, Xu; AI, GUO; Li, Yuexiang; Huang, Yawen; Zheng, Yefeng",poster,2301.06719,https://arxiv.org/abs/2301.06719,,https://huggingface.co/papers/2301.06719,,,,6,0
 Curvature-Aware Training for Coordinate Networks,"Saratchandran, Hemanth*; Chng, Shin-Fang; Ramasinghe, Sameera; MacDonald, Lachlan; Lucey, Simon",poster,2305.08552,https://arxiv.org/abs/2305.08552,,https://huggingface.co/papers/2305.08552,,,,5,0
 Pretrained Language Models as Visual Planners for Human Assistance,"Patel, Dhruvesh; Eghbalzadeh, Hamid; Kamra, Nitin; Iuzzolino, Michael; Jain, Unnat; Desai, Ruta P*",poster,2304.09179,https://arxiv.org/abs/2304.09179,,https://huggingface.co/papers/2304.09179,,,,6,0
 VQA Therapy: Exploring Answer Differences by Visually Grounding Answers,"Chen, Chongyan*; Anjum, Samreen; Gurari, Danna",poster,2308.11662,https://arxiv.org/abs/2308.11662,,https://huggingface.co/papers/2308.11662,,,,3,0
 Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using only Images,"Yu, Cuican*; Lu, Guansong; Zeng, Yihan; Sun, Jian; Liang, Xiaodan; Li, Huibin; Xu, Zongben; Xu, Songcen; Zhang, Wei; Xu, Hang",poster,2308.16758,https://arxiv.org/abs/2308.16758,,https://huggingface.co/papers/2308.16758,,,,10,0
+Zero-Shot Composed Image Retrieval with Textual Inversion,"Baldrati, Alberto*; Agnolucci, Lorenzo; Bertini, Marco; Del Bimbo, Alberto",poster,2303.15247,https://arxiv.org/abs/2303.15247,https://github.com/miccunifi/SEARLE,https://huggingface.co/papers/2303.15247,,,,4,2
 PatchCT: Aligning Patch Set and Label Set with Conditional Transport for Multi-Label Image Classification,"Wang, Dongsheng*; Li, Miaoge; Liu, Xinyang; Zeng, Zequn; Lu, Ruiying; Chen, Bo; Zhou, Mingyuan",poster,2307.09066,https://arxiv.org/abs/2307.09066,,https://huggingface.co/papers/2307.09066,,,,7,0
 Lip Reading for Low-resource Languages by Learning and Combining General Speech Knowledge and Language-specific Knowledge,"Kim, Minsu*; Yeo, Jeong Hun; Choi, Jeongsoo; Ro, Yong Man",poster,2308.09311,https://arxiv.org/abs/2308.09311,,https://huggingface.co/papers/2308.09311,,,,4,0
 ViewRefer: Grasp the Multi-view Knowledge for 3D Visual Grounding,"Guo, Ziyu*; Tang, Yiwen; Zhang, Renrui; Wang, Dong; Wang, Zhigang; Zhao, Bin; Li, Xuelong",poster,,,,,,,,,
 Prune Spatio-temporal Tokens by Semantic-aware Temporal Accumulation,"Ding, Shuangrui*; Zhao, Peisen; zhang, xiaopeng; Qian, Rui; Xiong, Hongkai; Tian, Qi",poster,2308.04549,https://arxiv.org/abs/2308.04549,https://github.com/Mark12Ding/STA,https://huggingface.co/papers/2308.04549,,,,6,0
 Differentiable Transportation Pruning,"Li, Yunqiang*; van Gemert, Jan C; Hoefler, Torsten; Moons, Bert; Eleftheriou, Evangelos; Verhoef, Bram-Ernst",poster,2307.08483,https://arxiv.org/abs/2307.08483,,https://huggingface.co/papers/2307.08483,,,,6,0
 XiNet: Efficient Neural Networks for tinyML,"Ancilotto, Alberto*; Paissan, Francesco; Farella, Elisabetta",poster,,,,,,,,,
+Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers,"Frumkin, Natalia*; Gope, Dibakar; Marculescu, Diana",poster,2308.10814,https://arxiv.org/abs/2308.10814,https://github.com/enyac-group/evol-q,https://huggingface.co/papers/2308.10814,,,,3,1
 A2Q: Accumulator-Aware Quantization with Guaranteed Overflow Avoidance,"Colbert, Ian*; Pappalardo, Alessandro; Petri-Koenig, Jakoba",poster,2308.13504,https://arxiv.org/abs/2308.13504,,https://huggingface.co/papers/2308.13504,,,,3,0
 Workie-Talkie: Accelerating Federated Learning by Overlapping Computing and Communications via Contrastive Regularization,"Chen, Rui*; Wan, Qiyu ; Prakash, Pavana; Zhang, Lan; Yuan, Xu; Gong, Yanmin; Fu, Xin; Pan, Miao",poster,,,,,,,,,
 DenseShift: Towards Accurate and Transferable Low-Bit Shift Network,"Li, Xinlin*; Liu, Bang; Yang, Rui Heng; Courville, Vanessa; Xing, Chao; Partovi Nia, Vahid",poster,2208.09708,https://arxiv.org/abs/2208.09708,,https://huggingface.co/papers/2208.09708,,,,6,0
 SGAligner: 3D Scene Alignment with Scene Graphs,"Deb Sarkar, Sayan*; Miksik, Ondrej; Pollefeys, Marc; Barath, Daniel; Armeni, Iro",poster,,,,,,,,,
 Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation,"Wu, Jianzong; Li, Xiangtai*; Ding, Henghui; Li, Xia; Cheng, Guangliang; Tong, Yunhai; Loy, Chen Change",poster,2301.00805,https://arxiv.org/abs/2301.00805,,https://huggingface.co/papers/2301.00805,,,,7,0
 SLAN: Self-Locator Aided Network for Vision-language Understanding,"Zhai, Jiang-Tian*; Zhang, Qi; Wu, Tong; Chen, Xingyu; Liu, Jiang-Jiang; Cheng, Ming-Ming",poster,,,,,,,,,
+Task-Oriented Multi-Modal Mutual Leaning for Vision-Language Models,"Long, Sifan*; Zhao, Zhen; Yuan, Junkun; Tan, Zichang; Liu, Jiang-Jiang; Zhou, Luping; Wang, Shengsheng; Wang, Jingdong",poster,2303.17169,https://arxiv.org/abs/2303.17169,,https://huggingface.co/papers/2303.17169,,,,8,1
 TinyCLIP: CLIP Distillation via Affinity Mimicking and Weight Inheritance,"Wu, Kan*; Peng, Houwen; Zhou, Zhenghong; Xiao, Bin; Liu, Mengchen; Yuan, Lu; Xuan, Hong; Valenzuela, Michael L; Chen, Xi; Chao, Hongyang; Wang, Xinggang; Hu, Han",poster,,,,,,,,,
 In-Style: Unsupervised Text-Video Retrieval with Style Preservation,"Shvetsova, Nina*; Kukleva, Anna; Schiele, Bernt; Kuehne, Hilde",poster,,,,,,,,,
 Preserving Modality Structure Improves Multi-Modal Learning ,"Swetha, Sirnam*; Rizve, Mamshad Nayeem; Shvetsova, Nina; Kuehne, Hilde; Shah, Mubarak",poster,,,,,,,,,
 Graph Matching with Bi-level Noisy Correspondence,"Lin, Yijie; Yang, Mouxing; Yu, Jun; Hu, Peng; Zhang, Changqing; Peng, Xi*",poster,2212.04085,https://arxiv.org/abs/2212.04085,https://github.com/XLearning-SCU/2023-ICCV-COMMON,https://huggingface.co/papers/2212.04085,,,,6,0
 Anomaly Detection using Score-based Perturbation Resilience,"Shin, Woosang*; Lee, Jong-Hyeon; Lee, Taehan; Lee, Sangmoon; Yun, Jong Pil",poster,,,,,,,,,
 Spatio-Temporal Domain Awareness for Multi-Agent Collaborative Perception,"yang, kun*; Yang, Dingkang; Zhang, Jingyu; Li, Mingcheng; Liu, Yang; Liu, Jing; Wang, Hanqi; Sun, Peng; Song, Liang ",poster,2307.13929,https://arxiv.org/abs/2307.13929,,https://huggingface.co/papers/2307.13929,,,,9,0
+Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing,"Baldrati, Alberto; Morelli, Davide*; Cartella, Giuseppe; Cornia, Marcella; Bertini, Marco; Cucchiara, Rita",poster,2304.02051,https://arxiv.org/abs/2304.02051,https://github.com/aimagelab/multimodal-garment-designer,https://huggingface.co/papers/2304.02051,,,,6,1
 Towards Unifying Medical Vision-and-Language Pre-training via Soft Prompts,"Chen, Zhihong; Diao, Shizhe; wang, benyou; Li, Guanbin*; Wan, Xiang",poster,2302.08958,https://arxiv.org/abs/2302.08958,,https://huggingface.co/papers/2302.08958,,,,5,0
 MAS: Towards Resource-Efficient Federated Multiple-Task Learning,"Zhuang, Weiming*; Wen, Yonggang; Lyu, Lingjuan; zhang, shuai",poster,2307.11285,https://arxiv.org/abs/2307.11285,,https://huggingface.co/papers/2307.11285,,,,4,0
 Hierarchical Visual Categories Modeling in A Probabilistic Perspective for Out-of-Distribution Detection ,"Li, Jinglun; Zhou, Xinyu; Guo, Pinxue; Sun, Yixuan; Huang, Yiwen; Ge, Weifeng*; Zhang, Wenqiang",poster,,,,,,,,,