GPT-4o差点没及格！首个多任务长视频评测基准，它有亿点难_ChatGPT_Openlab_cosmoplat