Deepbeat là gì?
Deepbeat không chỉ là một công cụ, nó còn là một dự án nghiên cứu đầy tham vọng, được thai nghén bởi một nhóm sinh viên tiến sĩ tài năng đến từ Đại học Aalto, Phần Lan.
Dự án này ra đời với mong muốn khám phá những giới hạn của AI và thách thức những định kiến về khả năng sáng tạo của máy móc. Thay vì tập trung vào những ứng dụng khô khan và thuần túy kỹ thuật, Deepbeat hướng đến một lĩnh vực nghệ thuật, cụ thể là âm nhạc, để chứng minh rằng AI cũng có thể đóng góp vào quá trình sáng tạo.
Động lực thúc đẩy sự ra đời của Deepbeat:
- Thách thức những giả định chống lại AI: Nhóm nghiên cứu muốn chứng minh rằng AI không chỉ là công cụ tính toán, mà còn có khả năng sáng tạo, tạo ra những sản phẩm có giá trị nghệ thuật.
- Tạo ra một cái gì đó mà công chúng có thể liên quan đến: Âm nhạc là một phần không thể thiếu trong cuộc sống của con người, và việc sử dụng AI để tạo ra âm nhạc có thể giúp công chúng dễ dàng tiếp cận và hiểu hơn về công nghệ này.
- Cung cấp tiềm năng thương mại: Deepbeat không chỉ là một dự án nghiên cứu, mà còn có tiềm năng thương mại, có thể được sử dụng để hỗ trợ các nghệ sĩ rap trong quá trình sáng tác hoặc tạo ra những sản phẩm âm nhạc độc đáo.
Deepbeat hoạt động như thế nào?
Để có thể tạo ra lời bài hát rap, Deepbeat phải trải qua một quá trình xử lý phức tạp, bao gồm nhiều bước:
- Thu thập dữ liệu:
Đầu tiên, Deepbeat cần một lượng lớn dữ liệu để học hỏi. Dữ liệu này bao gồm hàng ngàn bài hát rap từ nhiều nghệ sĩ khác nhau. Kho dữ liệu này đóng vai trò như một thư viện, nơi Deepbeat có thể tìm kiếm và học hỏi những cấu trúc, vần điệu và chủ đề thường gặp trong rap.
- Phân tích dữ liệu: Sau khi có dữ liệu, Deepbeat sẽ sử dụng các thuật toán để phân tích và trích xuất thông tin quan trọng, chẳng hạn như:
- Cấu trúc câu:
- Vần điệu:
- Chủ đề:
- Tạo lời bài hát: Dựa trên những thông tin đã học được, Deepbeat sẽ sử dụng các thuật toán để tạo ra những dòng lời mới. Quá trình này bao gồm việc:
- Chọn từ ngữ phù hợp với chủ đề.
- Sắp xếp từ ngữ để tạo ra những câu có nghĩa.
- Tìm kiếm những từ có vần điệu để tạo ra những dòng rap có tính nhạc điệu.
Mô hình xây dựng của Deepbeat:
Deepbeat giải quyết bài toán tạo lời bài hát rap như một nhiệm vụ truy xuất thông tin. Cho trước một chuỗi 'n' dòng, làm thế nào để tạo ra một tập hợp các lời bài hát rap có liên quan và có vần?
- Cách tiếp cận: Tạo lời bài hát rap như một nhiệm vụ truy xuất thông tin.
- Sử dụng kho lưu trữ lớn các bài hát làm cơ sở dữ liệu chính.
- Sử dụng mô hình để xác định tập hợp ứng viên theo các yếu tố thành công.
- Lặp lại cho đến khi lời bài hát được tạo ra từng dòng một.
Những yếu tố làm nên một bài rap hay
Theo Deepbeat, có ba yếu tố chính làm nên một bài rap hay:
- Vần điệu (Rhyming): Vần điệu là yếu tố quan trọng nhất của rap, tạo nên tính nhạc điệu và sự hấp dẫn cho bài hát. Vần điệu có thể được tạo ra bằng cách sử dụng những từ có âm cuối giống nhau hoặc tương tự nhau.
- Cấu trúc tương đồng (Structural similarity): Cấu trúc tương đồng đề cập đến độ dài của mỗi dòng trong bài rap. Những dòng có độ dài tương đồng sẽ tạo ra một nhịp điệu ổn định và dễ nghe.
- Tính tương đồng về ngữ nghĩa (Semantic similarity): Tính tương đồng về ngữ nghĩa đề cập đến chủ đề của bài rap. Một bài rap hay nên có một chủ đề rõ ràng và mạch lạc, giúp người nghe dễ dàng hiểu được thông điệp mà nghệ sĩ muốn truyền tải.
Vần điệu trong Rap: Một khuôn mẫu của vần điệu thường được sử dụng cho 4 dòng. Loại vần điệu phổ biến nhất là Assonance (chỉ các âm nguyên âm được chia sẻ).
Các bước để tạo dữ liệu cho mô hình
Để có thể định lượng vần điệu, một thước đo gọi là mật độ vần điệu đã được giới thiệu.
- Biên soạn danh sách các bài hát từ 10,980 bài hát rap của 104 nghệ sĩ nổi tiếng.
- Quét lời bài hát để tìm chuỗi nguyên âm phù hợp dài nhất.
-
Tính toán mật độ vần điệu bằng cách tính trung bình độ dài của các chuỗi nguyên âm phù hợp dài nhất.
Để tạo điều kiện thuận lợi cho quá trình so sánh và tìm kiếm vần điệu, Deepbeat sử dụng một số kỹ thuật xử lý dữ liệu đặc biệt:
- Chuyển đổi ngữ âm (Phonetic Transcription): Lời bài hát được chuyển đổi thành dạng ngữ âm, giúp máy tính dễ dàng nhận diện những từ có âm thanh tương tự nhau.
- Loại bỏ phụ âm (Remove Consonants): Để tập trung vào vần điệu, các phụ âm được loại bỏ, chỉ giữ lại các nguyên âm.
- Đảo ngược thứ tự (Reverse the order): Các dòng lời được đảo ngược thứ tự, giúp Deepbeat dễ dàng tìm kiếm những dòng có vần điệu tương đồng ở cuối câu.