DANH MỤC TÀI LIỆU
Tìm hiểu về Microsoft Cognitive Services
Tìm hi u v Microsoft Cognitive Servicesể ề
ng d ng hi n đ i có xu h ng tăng c ng các tính năng thông minh s ệ ạ ướ ườ
d ng các thu t toán ph c t p hay tích h p các công ngh tân ti n nh trí ứ ạ ế ư
tu nhân t o vào trong ng d ng, giúp tăng tr i nghi m c a ng i s d ng ườ ử ụ
b ng kh năng gi i quy t các v n đ c a ng i dùng m t cách thông minh ế ề ủ ườ
và linh ho t h n. Tuy nhiên vi c vi t ra các thu t toán ph c t p không ph i ơ ế ứ ạ
là chuy n m t s m m t chi u và không ph i l p trình viên nào cũng có th ả ậ
làm đ c. V y v i nh ng l p trình viên không có kh năng làm nh ng vi cượ ậ ớ
nh v y, h s cam ch u ch p nh n b b xa v i xu h ng trên ?ư ọ ẽ ướ ư
Câu tr l i là KHÔNG! Trong bài vi t hôm nay mình s gi i thi u v i các ả ờ ế
b n m t d ch v r t thú v c a Microsoft, giúp thu h p kho ng cách gi a ụ ấ
các l p trình viên trong vi c tích h p các công ngh tân ti n nh trí tu ế ư
nhân t o vào trong ng d ng. D ch v mà mình mu n nói t i có tên ị ụ
Microsoft Cognitive Services. V i Cognitive Services c a Microsoft, cho ớ ủ
phép l p trình viên có th tích h p các thu t toán thông minh, s d ng s c ử ụ
m nh c a machine learning vào ngay trong ng d ng ch v i vài dòng code. ỉ ớ
V y Microsoft Cognitive Services là gì?
Microsoft Cognitive Services là gì?
Microsoft Cognitive Services bao g m m t b các API ng d ng trí tu ộ ộ
nhân t o thông minh, cho phép l p trình viên m i c p đ t nh ng b n ộ ừ
sinh viên vi t ng d ng đ u tiên c a mình hay nh ng l p trình viên chuyênế ứ
nghi p làm vi c cho nh ng công ty, t ch c l n đ u có th t o ra đ c ể ạ ư
nh ng ng thông minh h n m t cách d dàng. ữ ứ ơ
Các API c a Cognitive Services đ c vi t d i d ng REST API do v y l p ượ ế ướ ạ ậ ậ
trình viên có th tích h p các API này trên nhi u n n t ng khác nhau nh ề ả ư
iOS, Android, hay Windows, ch c n có k t n i Internet.ỉ ầ ế
Tính đ n th i đi m vi t bài vi t này, Microsoft Cognitive Services bao g mế ờ ể ế ế
21 API đ c chia thành 5 nhóm: Vision, Speech, Language, Knowledge và ượ
Search. Hãy cùng tìm hi u 5 nhóm API này là gì?
Vision API
Là nhóm API liên quan đ n x lý hình nh, trong nhóm Vision API này hi nế ử
Microsoft cung c p 4 API sau:
Computer Vision API: API này cho phép trích xu t nh ng thông tin có giá ấ ữ
tr t b c nh c a b n v i kh năng xác đ nhị ừ đ c ki u đ i t ng trong ượ ố ượ
nh (là bánh mỳ, con chó, con mèo hay cây c i, …) hay n u là ng i thì ế ườ
API này cũng xác đ nh đ c gi i tính c a nhân v t trong nh.ượ Ngoài ra, API
này cũng h tr nh n di n đ c nh ng nh n v t n i ti ng hay trích xu t ợ ậ ệ ượ ậ ậ ế
ch có trong b c hình c a b n. ủ ạ
Face API: Cái tên nói lên t t c , đây là API cho phép phát hi n khuôn m t ấ ả
có trong b c hình c a b n. Ngoài ra, API này cũng tr v các thu c tính ả ề
c a khuôn m t nh tu i, gi i tính, đ r ng ng i c a n c i hay th m chí ư ộ ạ ườ
là chi u dài c a tóc, … Ngoài phát hi n khuôn m t, Face API còn cho phép ề ủ
so sánh 2 khuôn m t có ph i là c a cùng m t ng i hay không. ộ ườ
Emotion API: API này cho phép xác đ nh tâm tr ng c a ng i có trong b cạ ủ ườ
hình xem h đang vui, đang bu n hay đang gi n d . ậ ữ
Video API: API này là m t t p h p các thu t toán x lý video tân ti n c a ộ ậ ế
Microsoft. V i Video API, các nhà phát tri n có th tích h p các tính ể ợ
năng ch nh s a video bao g m ch ng rung, phát hi n khuôn m t ng i, ặ ườ
phát hi n chuy n đ ng hay t o video thumbnail. ể ộ
Speech API
Là nhóm API liên quan đ n x lý âm thanh v i công ngh x lý đ n t ế ệ ử ế
Bing. Trong nhóm Speech API này hi n Microsoft cung c p 3 API:ệ ấ
Bing Speech API: API này cho phép trích xu t m t t p tin âm thanh sang ộ ậ
d ng ch , chuy n đ i đ nh d ng ch sang âm thanh (t c là đ c ch ) hay ạ ữ ạ ữ
đoán ý c a m t câu nói.ủ ộ
Custom Recognition Intelligent Service (CRIS): CRIS cho phép b n
th tùy bi n language model và acoustic model sao cho phù h p v i ng ế ớ ứ
d ng ho c ng i dùng c a b n. ườ ủ ạ
Speaker Recognition API: V i nh ng thu t toán nh n d ng gi ng nói tân ậ ạ
ti n c a Microsoft, API này cho phép nh n d ng gi ng nói c a ng i nói ế ủ ườ
trong m t t p tin âm thanh. API này bao g m 2 thành ph n: speaker ộ ậ
verification và speaker identification t m d ch t ng ng là xác nh n ng i ươ ứ ườ
nói và xác đ nh ng i nói. Speaker Verification cho phép xác nh n và xác ị ườ
th c ng i dùng b ng gi ng nói c a h . L p trình viên ch c n cho ng i ườ ỉ ầ ườ
dùng đ c m t đo n văn b n có s n đ l u l i d li u gi ng nói c a h ể ư
(enrollment) r i m i l n c n xác th c, ng i dùng ch c n đ c l i chính ồ ở ườ
xác đo n văn b n đã đ c dùng đ l y d li u gi ng nói c a mình (b c ượ ể ấ ướ
enrollment) đ xác th c. Speaker Identification có th xác đ nh đ c ng i ượ ườ
đang nói trong m t t p tin âm thanh d a trên m t t p d li u các ng i nóiộ ậ ộ ậ ữ ệ ườ
ti m năng. Tính năng này cũng có th đ c s d ng đ xác th c ng i ể ượ ử ụ ườ
dùng b ng gi ng nói. Tuy nhiên thay vì ph i đ c chính xác m t đo n văn ả ọ
b n c đ nh nh Speaker Verification thì khi s d ng tính năng Speaker ố ị ư ử ụ
Identification này, ng i dùng có th đ c m t đo n văn b n b t kỳ, API s ườ ể ọ
phân tích và đ i chi u v i t p d li u gi ng nói c a ng i dùng đ so ế ớ ậ ữ ệ ườ
sánh và xác th c.
Language API
Là nhóm API liên quan đ n x lý ngôn ng . Nhóm Language API này hi n ế ử
đ c Microsoft cung c p 5 API:ượ ấ
Bing Spell Check API: API này cho phép phát hi n và s a các l i chính t ệ ử
có trong m t đo n văn b n mà b n cung c p. API còn có kh năng phát ộ ạ
hi n t lóng, s a l i tên riêng hay s a các t đ ng âm, … ừ ồ
thông tin tài liệu
Microsoft Cognitive Services bao gồm một bộ các API ứng dụng trí tuệ nhân tạo thông minh, cho phép lập trình viên ở mọi cấp độ từ những bạn sinh viên viết ứng dụng đầu tiên của mình hay những lập trình viên chuyên nghiệp làm việc cho những công ty, tổ chức lớn đều có thể tạo ra được những ứng thông minh hơn một cách dễ dàng.
Mở rộng để xem thêm
xem nhiều trong tuần
yêu cầu tài liệu
Giúp bạn tìm tài liệu chưa có

LÝ THUYẾT TOÁN


×