AI Blog - Trung Thanh Nguyen

[GAN series] p3. Anime GAN

Trong hai bài trước, mình đã nói qua về khái niệm GAN và thực hành GAN với bộ dataset đơn giản: Mnist. Trong bài này, mình sẽ tiến hành code một GAN phức tạp hơn, trên dataset phức tạp hơn: bộ chân dung các nhân vật Anime.

Xem tiếp » 12 Jul 2020

[GAN series] p2. Chiến lược train GAN

Và sau một thời gian đọc và nghiên cứu sâu hơn về GAN, mình đã rút ra được nhiều kinh nghiệm và kĩ thuật cải thiện. Trong bài viết này, mình sẽ nói về các kĩ thuật cho DCGAN.

Xem tiếp » 11 Jul 2020

[GAN series] p1. GAN cơ bản

GAN là viết tắt “Generative Adversary Networks”, hướng tới việc sinh ra dữ liệu mới sau quá trình học. GAN có thể tự sinh ra một khuôn mặt mới, một con người, một đoạn văn, chữ viết, bản nhạc giao hưởng hay những thứ tương tự thế

Xem tiếp » 10 Jul 2020

[YOLO series] p2. Build YOLO from scratch

Trong bài trước mình đã viết về lý thuyết, tư tưởng, ưu nhược điểm của YOLO. Lý thuyết thôi là chưa đủ. Trong bài này, mình sẽ hướng dẫn bạn xây dựng và code từ đầu

Xem tiếp » 04 Jul 2020

[YOLO series] p1. Lý thuyết YOLO và YOLOv2

YOLO - You Only Look Once. Trong bài viết này, mình sẽ viết lý thuyết về YOLO và YOLO_v2 cùng lý do tại sao YOLO đang được ưa chuộng và sử dụng rộng rãi trong thực tế ...

Xem tiếp » 03 Jul 2020

Style Transfer - explain and code

Bạn nghĩ sao về một bức ảnh chụp (máy ảnh) Hà Nội nhưng lại mang phong cách tranh thiên tài Picasso. Với sự ra đời của thuật toán Style Transfer, chuyện đó là hoàn toàn có thể.

Xem tiếp » 02 Jul 2020

[Paper explain] YOLACT Realtime Instance Segmentation

Hầu hết các phương pháp Instance Segment đang được sử dụng phổ biến hiện nay được xây dựng dựa trên các two-stage detector. Tuy nhiên hướng giải pháp này vẫn có nhược điểm về tốc độ tính toán. Để giải quyết nhược điểm nêu trên, tác giả đã đề xuất YOLACT với kiến trúc one-stage ...

Xem tiếp » 01 Jul 2020

[Kaggle] Wheat head detection with FasterRCNN

Kaggle tổ chức 1 cuộc thi với chủ đề nhận dạng bông lúa mì trong các bức ảnh. Việc nhận dạng lúa mì có ý nghĩa rất lớn đối với các nghiên cứu trong nông nghiệp. Người ta có thể xác định được số lượng, mật độ, kích thước bông lúa, khoảng cách giữa các bông (xác định đang trồng thưa hay trồng dày) trong từng thời kì....

Xem tiếp » 01 Jun 2020

[Image processing] Histogram equalization

Trong thực tế, camera thường chịu tác động từ điều kiện sáng. Điều đó khiến cho nhiều ảnh bị tối hoặc quá sáng. Cân bằng histogram là một phương pháp tiền/hậu xử lí ảnh rất mạnh mẽ. Đặc biệt trong nhiều bài toán compute vision, phương pháp tiền xử lí này cho chất lượng dữ liệu cao, cải thiện chất lượng model deep learning rất nhiều.

Xem tiếp » 02 May 2020

[Image processing] Image Stitching - thuật toán đằng sau công nghệ ảnh Panorama

Chắc hẳn mọi người đều đã từng thấy hoặc sử dụng chức năng chụp ảnh panorama của Smart phone. Những tấm ảnh panorama này có kích thước khá lớn, view rộng và với smart phone, ta có thể tạo ra bằng cách lia camera từ từ qua khung cảnh cần chụp. Vậy làm sao để tạo ra được 1 bức ảnh cực lớn từ nhiều ảnh nhỏ...

Xem tiếp » 01 May 2020

[Speech] p3. Speech synthesis - Tacotron2

Xem tiếp » 03 Apr 2020

[Speech] p2. Feature extraction - MFCC

Trong bài này, mình sẽ tập trung vào việc biến đổi tín hiệu giọng nói thành dạng MFCC. MFCC được dùng phổ biến trong bài toán speech recognize và nhiều bài toán liên quan tới giọng nói khác.

Xem tiếp » 02 Apr 2020

[Speech] p1. Cơ bản về xử lí giọng nói

Trong phần này mình sẽ viết trọng tâm vào lý thuyết âm thanh và ngữ âm học. Có thể bạn sẽ thấy nhàm chán, nhưng nếu muốn đào sâu hơn và phát triển trong lĩnh vực "xử lý tiếng nói", ta cần có những kiến thức nền tảng vững chắc thay vì đọc qua loa vài thuật toán, paper nhỏ lẻ.

Xem tiếp » 01 Apr 2020

CTC loss

CTC ra đời đã giải quyết được vấn đề phức tạp trong việc alignment giữa input và output - điển hình trong các bài toán Text Recognition và Speech to text...

Xem tiếp » 01 Mar 2020

Entropy, cross entropy, KL divergence

Hầu hết mọi người đều nghe tới khái niệm cross entropy như một hàm loss function phổ biến trong các bài toán classify. Vậy entropy là gì ?

Xem tiếp » 02 Feb 2020

Train model với GPU Google Colab

Làm việc với Deep Learning nghĩa là bạn phải nghiên cứu và xây dựng các model, đòi hỏi máy tính phải có khả năng tính toán lớn. Quá trình training model - hay huấn luyện mô hình thường cần tới GPU. Bài này sẽ hướng dẫn cách sử dụng free GPU trên Google Colab.

Xem tiếp » 01 Feb 2020

Learn how to learn - Não bộ và phương pháp Pomodoro

Bộ não con người là một siêu siêu máy tính. Điều đó cũng có nghĩa là nếu biết tận dụng, bất kì ai cũng có thể trở thành thiên tài. Tuy nhiên, dù được ban phát cho 1 chiếc siêu máy tính nhưng chúng ta chẳng ai có quyển sách hướng dẫn sử dụng...

Xem tiếp » 02 Jan 2020

Con đường AI của tôi

Gần đây, nhiều bạn nhắn tin hỏi mình đại loại như: có nên học AI, bắt đầu học AI như nào, làm sao tự học cho đúng, cho nhanh, học không nản, lộ trình học AI như nào... Sau nhiều lần trả lời, mình nghĩ rằng nên viết hẳn một bài để trả lời chi tiết hơn. Bài viết nói về những ngày đầu mình mới tiếp cận lĩnh vực này cho đến bây giờ. Nó phù hợp cho các bạn sinh viên đang lạc hướng - những bạn phân vân rằng có nên theo đuổi AI, kể cả các bạn sinh viên kinh tế muốn chuyển ngành

Xem tiếp » 01 Jan 2020