: 10h00, ngày 15/05/2018 (Thứ Ba)
: P104 D3, ĐH Bách Khoa Hà Nội
: Machine Learning và Data Mining
: Nguyễn Trọng Dũng - Nguyễn Tuấn Anh
: AXON
Tóm tắt báo cáo
Báo cáo trình bày về một số giải pháp học sâu trong thị giác máy và nhận dạng tiếng nói. Báo cáo gồm 2 phần, sử dụng mạng thặng dư (residual networks) trong nhận dạng hình ảnh và nhận dạng tiếng nói (speech2text) bằng các mạng neural nhiều lớp ẩn.