[GAN series] p3. Anime GAN


    Trong hai bài trước, mình đã nói qua về khái niệm GAN và thực hành GAN với bộ dataset đơn giản: Mnist. Trong bài này, mình sẽ tiến hành code một GAN phức tạp hơn, trên dataset phức tạp hơn: bộ chân dung các nhân vật Anime.

    Xem tiếp »

    [GAN series] p2. Chiến lược train GAN


    Và sau một thời gian đọc và nghiên cứu sâu hơn về GAN, mình đã rút ra được nhiều kinh nghiệm và kĩ thuật cải thiện. Trong bài viết này, mình sẽ nói về các kĩ thuật cho DCGAN.

    Xem tiếp »

    [GAN series] p1. GAN cơ bản


    GAN là viết tắt “Generative Adversary Networks”, hướng tới việc sinh ra dữ liệu mới sau quá trình học. GAN có thể tự sinh ra một khuôn mặt mới, một con người, một đoạn văn, chữ viết, bản nhạc giao hưởng hay những thứ tương tự thế

    Xem tiếp »

    [YOLO series] p2. Build YOLO from scratch


    Trong bài trước mình đã viết về lý thuyết, tư tưởng, ưu nhược điểm của YOLO. Lý thuyết thôi là chưa đủ. Trong bài này, mình sẽ hướng dẫn bạn xây dựng và code từ đầu

    Xem tiếp »

    [YOLO series] p1. Lý thuyết YOLO và YOLOv2


    YOLO - You Only Look Once. Trong bài viết này, mình sẽ viết lý thuyết về YOLO và YOLO_v2 cùng lý do tại sao YOLO đang được ưa chuộng và sử dụng rộng rãi trong thực tế ...

    Xem tiếp »

    Style Transfer - explain and code


    Bạn nghĩ sao về một bức ảnh chụp (máy ảnh) Hà Nội nhưng lại mang phong cách tranh thiên tài Picasso. Với sự ra đời của thuật toán Style Transfer, chuyện đó là hoàn toàn có thể.

    Xem tiếp »

    [Paper explain] YOLACT Realtime Instance Segmentation


    Hầu hết các phương pháp Instance Segment đang được sử dụng phổ biến hiện nay được xây dựng dựa trên các two-stage detector. Tuy nhiên hướng giải pháp này vẫn có nhược điểm về tốc độ tính toán. Để giải quyết nhược điểm nêu trên, tác giả đã đề xuất YOLACT với kiến trúc one-stage ...

    Xem tiếp »

    [Kaggle] Wheat head detection with FasterRCNN


    Kaggle tổ chức 1 cuộc thi với chủ đề nhận dạng bông lúa mì trong các bức ảnh. Việc nhận dạng lúa mì có ý nghĩa rất lớn đối với các nghiên cứu trong nông nghiệp. Người ta có thể xác định được số lượng, mật độ, kích thước bông lúa, khoảng cách giữa các bông (xác định đang trồng thưa hay trồng dày) trong từng thời kì....

    Xem tiếp »

    [Image processing] Histogram equalization


    Trong thực tế, camera thường chịu tác động từ điều kiện sáng. Điều đó khiến cho nhiều ảnh bị tối hoặc quá sáng. Cân bằng histogram là một phương pháp tiền/hậu xử lí ảnh rất mạnh mẽ. Đặc biệt trong nhiều bài toán compute vision, phương pháp tiền xử lí này cho chất lượng dữ liệu cao, cải thiện chất lượng model deep learning rất nhiều.

    Xem tiếp »

    [Image processing] Image Stitching - thuật toán đằng sau công nghệ ảnh Panorama


    Chắc hẳn mọi người đều đã từng thấy hoặc sử dụng chức năng chụp ảnh panorama của Smart phone. Những tấm ảnh panorama này có kích thước khá lớn, view rộng và với smart phone, ta có thể tạo ra bằng cách lia camera từ từ qua khung cảnh cần chụp. Vậy làm sao để tạo ra được 1 bức ảnh cực lớn từ nhiều ảnh nhỏ...

    Xem tiếp »

    [Speech] p2. Feature extraction - MFCC


    Trong bài này, mình sẽ tập trung vào việc biến đổi tín hiệu giọng nói thành dạng MFCC. MFCC được dùng phổ biến trong bài toán speech recognize và nhiều bài toán liên quan tới giọng nói khác.

    Xem tiếp »

    [Speech] p1. Cơ bản về xử lí giọng nói


    Trong phần này mình sẽ viết trọng tâm vào lý thuyết âm thanh và ngữ âm học. Có thể bạn sẽ thấy nhàm chán, nhưng nếu muốn đào sâu hơn và phát triển trong lĩnh vực "xử lý tiếng nói", ta cần có những kiến thức nền tảng vững chắc thay vì đọc qua loa vài thuật toán, paper nhỏ lẻ.

    Xem tiếp »

    CTC loss


    CTC ra đời đã giải quyết được vấn đề phức tạp trong việc alignment giữa input và output - điển hình trong các bài toán Text Recognition và Speech to text...

    Xem tiếp »

    Entropy, cross entropy, KL divergence


    Hầu hết mọi người đều nghe tới khái niệm cross entropy như một hàm loss function phổ biến trong các bài toán classify. Vậy entropy là gì ?

    Xem tiếp »

    Train model với GPU Google Colab


    Làm việc với Deep Learning nghĩa là bạn phải nghiên cứu và xây dựng các model, đòi hỏi máy tính phải có khả năng tính toán lớn. Quá trình training model - hay huấn luyện mô hình thường cần tới GPU. Bài này sẽ hướng dẫn cách sử dụng free GPU trên Google Colab.

    Xem tiếp »

    Learn how to learn - Não bộ và phương pháp Pomodoro


    Bộ não con người là một siêu siêu máy tính. Điều đó cũng có nghĩa là nếu biết tận dụng, bất kì ai cũng có thể trở thành thiên tài. Tuy nhiên, dù được ban phát cho 1 chiếc siêu máy tính nhưng chúng ta chẳng ai có quyển sách hướng dẫn sử dụng...

    Xem tiếp »

    Con đường AI của tôi


    Gần đây, nhiều bạn nhắn tin hỏi mình đại loại như: có nên học AI, bắt đầu học AI như nào, làm sao tự học cho đúng, cho nhanh, học không nản, lộ trình học AI như nào... Sau nhiều lần trả lời, mình nghĩ rằng nên viết hẳn một bài để trả lời chi tiết hơn. Bài viết nói về những ngày đầu mình mới tiếp cận lĩnh vực này cho đến bây giờ. Nó phù hợp cho các bạn sinh viên đang lạc hướng - những bạn phân vân rằng có nên theo đuổi AI, kể cả các bạn sinh viên kinh tế muốn chuyển ngành

    Xem tiếp »