語音基礎模型及其性能基準工作坊

發佈日期： 2023-12-11

語音基礎模型及其性能基準工作坊

隨著人工智慧不斷發展，基石模型已經成為焦點，並在計算機視覺（CV）和自然語言處理（NLP）領域中發揮至關重要的作用。這些模型包括在NLP領域中的BERT和GPT，以及在CV領域中的SimCLR和BYOL，它們顯著提升了機器學習在這些領域的能力。在語音的領域中，我們也觀察到了這些基石模型在各種任務上展示了卓越的能力。許多學術活動中都有響應對於基石模型的關注, 例如 NeurIPS 2020、AAAI 2022 和ICASSP 2023的研討會都對這些模型的潛力表示了樂觀的反饋。

在這種勢頭上，此研討會將聚焦在：語音基石模型的基準(Benchmark)。這些基準被用來評估語音基石模型的性能。SUPERB 和 SUPERB-SG 測量了各種語音任務，而SLUE 專注於口語語言理解。然而，這些基準主要限於英語。為了促進更全面的分析，LeBenchmark 和 IndicSUPERB 分別評估了法語和印度語的基石模型。XTREME-S 和 ML-SUPERB 在超過100種語言上評估基石模型。值得注意的是，還存在一些正在發展中的基準，包括用於視聽 (audio-visual) 基石模型和指導微調 (instruction-finetuning) 基石模型的基準。改進這些基準仍然需要一個充滿活力且持續進行的對話。

Agenda:

ASRU衛星研討會「語音基礎模型及其性能基準工作坊(SPARKS)」
活動日期：2023年12月16日
活動方式：實體會議
活動地點：台北市北投區奇岩路一號台北市北投區大地酒店(7F) 環景宴會廳
活動官網： 點擊連結

最新消息

語音基礎模型及其性能基準工作坊

Agenda:

臺灣AI卓越中心推動辦公室

常用連結