Những điều cơ bản về chất lượng âm thanh

Audio codec là chương trình nén dữ liệu để truyền và giải nén dữ liệu đó ở đầu nhận. Tốc độ của chúng được đo bằng hàng nghìn bit được xử lý mỗi giây, được gọi là “bitrate” hoặc “kbps” và con số này thay đổi ngay cả trong một định dạng duy nhất. Nói chung, tốc độ bit thấp hơn có nghĩa là tệp nhỏ hơn, nhưng điều đó cũng có nghĩa là nhiều dữ liệu hơn (âm thanh) bị mất trong quá trình nén.

Các yếu tố quan trọng khác là sample rate và bit depth. Sample rate là số lượng mẫu (biên độ tín hiệu hoặc “âm thanh”) trên giây. Bit Depth đề cập đến số lượng bit trên mỗi mẫu – con số này càng cao, âm thanh càng đầy đủ (và có khả năng to hơn).

Uncompressed Audio

Âm thanh không nén – Uncompressed audio chính xác như tên của nó vậy: dữ liệu thô, độ trung thực đầy đủ mà không có thông tin bị thiếu hoặc bị thay đổi. Do đó, nó chiếm nhiều dung lượng ổ cứng nhất, yêu cầu âm thanh lên tới 10MB mỗi phút. Thông thường, các định dạng âm thanh không nén được sử dụng cho các chương trình sân khấu và truyền hình quy mô lớn và để lưu trữ hoặc lưu trữ âm thanh.

3 định dạng nén phổ biến của audio
3 định dạng nén phổ biến của audio

Các loại định dạng thuộc kiểu này như:

Định dạng .PCM, .WAV, .AIFF

PCM, hay Pulse-Code Modulation là một định dạng âm thanh không nén thường được sử dụng trong đĩa CD và DVD. Định dạng này sử dụng “sampling rate” xác định tần suất âm thanh gốc được lấy mẫu và “bit depth” xác định số lượng bit được sử dụng để xác định mỗi mẫu.

WAV, hoặc Waveform Audio File Format thường được sử dụng làm định dạng trình bao bọc để lưu trữ âm thanh định dạng PCM, làm cho nó phù hợp hơn với máy tính Windows.

AIFF, hoặc Audio Interchange File Format như WAV, thường được sử dụng làm định dạng trình bao bọc để lưu trữ âm thanh định dạng PCM, ngoại trừ máy tính Mac.

Định dạng nén Lossless

Thể loại này đã là chủ đề của nhiều sự phát triển trong những năm gần đây. Âm thanh thuộc loại này được nén; tức là, dữ liệu gốc của nó được làm nhỏ hơn bằng cách sử dụng các thuật toán có thể thu nhỏ kích thước tệp một cách thông minh.

Nén không mất dữ liệu là một phương pháp mới hơn để giảm kích thước tệp và yêu cầu nhiều năng lượng máy tính hơn để chơi vì dữ liệu được tái tạo theo thời gian thực khi bạn phát tệp, dẫn đến việc tái tạo gần như hoàn hảo (do đó là ‘không mất dữ liệu’) đối với dữ liệu ban đầu không nén.

Ưu điểm là bạn duy trì độ trung thực của âm thanh và sử dụng ít dung lượng hơn nhiều, nhưng nhược điểm là nó không hiệu quả khi bạn đang cố gắng giảm thiểu việc sử dụng tài nguyên, chẳng hạn như trong công cụ trò chơi, phải phát và kết hợp các tệp trong khi chơi trò chơi .

Các loại định dạng file audio
Các loại định dạng file audio

Định dạng FLAC

Giống như M4A, FLAC là một định dạng âm thanh không mất dữ liệu (lossless audio). Không giống như M4A, FLAC là mã nguồn mở và có thuật toán nén hiệu quả hơn, có thể giảm 50-70% tệp so với kích thước ban đầu. Định dạng này phổ biến trong giới audiophile như một cách để lưu trữ các bộ sưu tập nhạc ở dạng chất lượng cao nhất của chúng. Vì là mã nguồn mở nên nó tương thích với nhiều thiết bị và chương trình.

Định dạng M4A

Tệp .M4A là một định dạng dựa trên Apple tương ứng với các tệp video .MPEG-4. Các tệp .M4A có tính năng nén không mất dữ liệu, cho phép chỉnh sửa nhiều lần mà không làm giảm chất lượng. So với các định dạng tệp âm thanh khác trong danh sách này, tệp .M4A có chất lượng tương tự nhưng kích thước tệp thấp hơn. Bạn sẽ thấy tệp .M4A phát âm thanh trên các sản phẩm của Apple như iPhone và iPod.

Định dạng APE

APE được gọi là Monkey’s Audio codec, hệ thống này tự hào có khả năng nén tốt hơn một chút so với các đối thủ cạnh tranh với chi phí là tiết kiệm tài nguyên hơn. Nó không hoàn toàn là mã nguồn mở và chưa được chấp nhận rộng rãi bên ngoài nền tảng Windows và trình phát di động cực nhanh

WMA Lossless

Định dạng này của Microsoft đã thu hút nhiều phản hồi trái chiều, với một số người cho rằng nó không cạnh tranh với các định dạng cạnh tranh, điều này có thể giải thích cho mức độ lan truyền tương đối khiêm tốn của nó. Tuy nhiên, nó là một định dạng vững chắc cho phép nén tốc độ bit thay đổi chất lượng cao của âm thanh cho các mục đích lưu trữ.

WV

WavPack là một codec mã nguồn mở khác cung cấp khả năng nén cực kỳ tốt, đặc biệt đối với nhạc có nhiều dải động (như cổ điển). Nó không được sử dụng rộng rãi, nhưng một tính năng làm nên sự khác biệt của nó là chế độ mã hóa ‘kết hợp’ tạo ra cả tệp nén bị mất dữ liệu có thể được sử dụng độc lập và tệp ‘sửa chữa’ có thể được kết hợp với tệp bị mất để khôi phục nguồn không mất mát

Định dạng nén Lossy

Nén mất dữ liệu – Lossy compression là phổ biến nhất và phù hợp nhất đối với các nhà soạn nhạc truyền thông vì chúng tôi thường được yêu cầu cung cấp tài liệu của mình ở một trong những định dạng này.

Ban đầu, các phương pháp nén tệp đều hoạt động bằng cách thực sự loại bỏ dữ liệu không cần thiết theo cách giống như các thuật toán nén hình ảnh hoạt động. Giờ đây, được gọi là định dạng ‘lossy’, các tệp này có kích thước nhỏ nhất nhưng cũng dẫn đến giảm chất lượng đáng kể, đặc biệt là ở tốc độ nén cao hơn.

Điều này đã làm cho chúng trở thành trụ cột của âm thanh trò chơi và các phương tiện khác, nơi cả kích thước và hiệu quả đều là những yếu tố đáng cân nhắc.

Chúng ta hãy xem xét các định dạng nén mất dữ liệu – lossy compression formats chính:

Đọc thêm: Toàn tập về các loại định dạng video phổ biến nhất hiện nay

Định dạng MP3

Các tệp .MP3 (MPEG-1 Audio Layer III) là tệp âm thanh phổ biến nhất hiện nay. MP3 có tính năng nén mất dữ liệu, có nghĩa là chất lượng của chúng sẽ giảm sút qua các lần chỉnh sửa tiếp theo. MP3 vẫn có kích thước tương đối lớn khi so sánh với các định dạng tệp âm thanh khác trong danh sách này.

Tệp MP3 hoạt động trên hầu hết các thiết bị và tệp có thể nhỏ bằng một phần mười kích thước của tệp không mất dữ liệu. MP3 phù hợp với người tiêu dùng, vì hầu hết âm thanh mà nó giảm xuống là không nghe được, nhưng đó không phải là trường hợp nói đến bit depth. “Các tệp MP3 chỉ có thể lên đến 16-bit, đó không phải thứ mà những người sản xuất âm nhạc thích làm việc với.

file audio mp3
file audio mp3

Định dạng AAC

Giống như MP3, Advanced Audio Coding hay AAC (cũng được biết đến là MPEG-4 AAC) cũng là tệp âm thanh mất dữ liệu (lossy audio). Tuy nhiên, các tệp .AAC, ở trạng thái ban đầu, có chất lượng cao hơn nhiều so với bất kỳ định dạng tệp âm thanh nào khác trong danh sách. Các tệp .AAC thường có kích thước tương tự như MP3, mặc dù có chất lượng cao hơn một chút.

Các tệp .AAC cũng là nguồn mở, có nghĩa là bạn không cần trả tiền bản quyền để tạo và phân phối chúng (không giống như tệp .MP3).

Yêu cầu nhạc dưới 1 MB mỗi phút và nghe hay hơn MP3 ở cùng tốc độ bit, định dạng AAC được iTunes / Apple Music, YouTube và Android sử dụng.

Định dạng .OGA, .OGG

Tương tự như tệp .AAC, tệp .OGA là mã nguồn mở và sử dụng tính năng nén mất dữ liệu. Họ sử dụng tốc độ bit thay đổi để cắt giảm kích thước tệp. Tuy nhiên, điều này không làm giảm chất lượng âm thanh tổng thể. Trên thực tế, các tệp .OGA có xu hướng có chất lượng cao hơn so với MP3. Tệp .OGA không được nhiều chương trình hỗ trợ – đặc biệt là so với .MP3 khá phổ biến.

Định dạng 3GP / 3G2

Định dạng này thực sự là một tập hợp con của các định dạng Mpeg-4 ở trên, nhưng nó được thiết kế đặc biệt cho việc sử dụng điện thoại di động và do đó chủ yếu chỉ quan tâm đến những người cung cấp các nền tảng như vậy.

Định dạng SPX

SPX được gọi là Speex, đây là một dự án tương tự như Vorbis, được thiết kế đặc biệt để sử dụng trong việc nén giọng nói cho podcast, Voice-Over-IP và các ứng dụng tương tự khác. Nó cũng có thể được đặt trong tệp vùng chứa OGG.

Định dạng RA / RAM

Định dạng RealAudio cũ hiếm khi gặp phải ngày nay ngoại trừ ở những vùng hoang dã sâu nhất của Internet cổ đại, nhưng nó là định dạng phân phối tiêu chuẩn cho nhiều tên tuổi lớn bao gồm cả BBC gần đây là năm 2009. Định dạng này là một trong những định dạng đầu tiên. được thiết kế để phát trực tuyến qua internet, nhưng không còn cạnh tranh với những người khác về độ trung thực của âm thanh.

Các loại file audio thường gặp
Các định dạng audio thường gặp

Các câu hỏi thường gặp khi nói đến định dạng audio

Định dạng nào tốt nhất cho chất lượng âm thanh?

Định dạng âm thanh Lossless là định dạng không làm mất dữ liệu là định dạng tốt nhất cho chất lượng âm thanh. Chúng bao gồm FLAC, WAV hoặc AIFF. Những loại tệp này được coi là “độ phân giải cao” vì chúng tốt hơn hoặc bằng chất lượng CD. Sự cân bằng là các tệp này sẽ rất lớn.

Định dạng tệp âm thanh nào tốt nhất để sử dụng trên Web?

Từ quan điểm tương thích của trình duyệt, .MP3 và .MP4 là định dạng tệp âm thanh tốt nhất để sử dụng trên Web. Tất cả các trình duyệt hiện đại đều hỗ trợ định dạng này, bao gồm cả IE9. Các định dạng khác được hầu hết các trình duyệt hỗ trợ bao gồm OGG, WebM, AAC và WAV.

Định dạng âm thanh nào phổ biến nhất?

Các tệp MP3 là định dạng âm thanh phổ biến nhất. Trong nhiều thập kỷ trước, sự phổ biến của chúng đã truyền cảm hứng cho toàn bộ danh mục thiết bị (Máy nghe nhạc MP3) và sự phổ biến của chúng vẫn tiếp tục cho đến ngày nay. MP3 có thể được tạo ở nhiều tốc độ bit khác nhau, được sử dụng để cân bằng chất lượng và kích thước của tệp. Kích thước hiệu quả của chúng đã khiến chúng trở thành định dạng tiêu chuẩn để trao đổi âm thanh trên Web.

Làm cách nào để chuyển đổi tệp âm thanh từ định dạng này sang định dạng khác?

Để chuyển đổi tệp theo cách thủ công, hãy sử dụng một chương trình như VLC Media Player để chuyển đổi giữa các định dạng tệp âm thanh phổ biến. Ngoài ra bạn vẫn có thể lựa chọn những phần mềm khác để lựa chọn hoặc lên thẳng google để chuyển đổi trực tuyến trên những trang web chuyển đổi.

Như thế nào là high-resolution audio?

Không giống như high-resolution video, không có tiêu chuẩn chung duy nhất khi nói đến âm thanh độ phân giải cao.

Tuy nhiên, theo thuật ngữ đơn giản nhất, âm thanh độ phân giải cao có xu hướng đề cập đến các audio có tần số sample hoặc bit depth cao hơn so với CD – được chỉ định ở 16-bit/44,1kHz. Ví dụ: các tệp độ phân giải cao có dạng 16-bit / 96kHz hoặc 24-bit / 192kHz.

Các tệp âm thanh độ phân giải cao có nhiều thông tin âm thanh bổ sung và do đó âm thanh tốt hơn nhiều so với các định dạng âm thanh nén, vốn làm mất thông tin trong quá trình nén. Chúng sẽ chiếm nhiều dung lượng lưu trữ hơn nhưng chúng tôi chắc chắn nghĩ rằng điều đó đáng để đánh đổi.

high-resolution audio - định dạng âm thanh
high-resolution audio – định dạng âm thanh

Cách chọn định dạng tệp âm thanh phù hợp

Việc chọn định dạng âm thanh phù hợp hoàn toàn phụ thuộc vào việc bạn định sử dụng âm thanh cho mục đích gì. Bạn nên chọn một định dạng đạt được chất lượng âm thanh mà bạn yêu cầu, chứ không phải chọn những định dạng nặng để có đủ chất lượng. Các tệp âm thanh chất lượng cao không cần thiết có thể khó sử dụng để di chuyển, chia sẻ, chuyển đổi và quản lý. Hãy xem xét một số tình huống:

  • Nếu bạn là một chuyên gia định chỉnh sửa âm thanh (ví dụ: cho podcast), thì hãy sử dụng định dạng không nén – uncompressed format. Bằng cách này, bạn sẽ duy trì chất lượng của âm thanh mỗi khi bạn chỉnh sửa và lưu tệp. Khi hoàn tất, bạn có thể xuất sang định dạng nén dễ phân phối hơn. Các định dạng không nén bao gồm PCM, WAV và AIFF.
  • Nếu bạn là một người đam mê âm thanh muốn nghe bộ sưu tập nhạc của mình với độ trung thực cao, hãy chọn định dạng âm thanh Lossless audio để nén âm thanh mà không mất dữ liệu. Bạn sẽ sử dụng ít dung lượng hơn so với định dạng không nén, nhưng vẫn giữ được chất lượng đầy đủ của bản ghi gốc. Các định dạng này bao gồm FLAC, WMA, M4A.
  • Nếu bạn không quan tâm đến chất lượng âm thanh hoàn hảo, hãy lên kế hoạch chia sẻ tệp trên Web hoặc cần tiết kiệm dung lượng đĩa, hãy chọn định dạng sử dụng tính năng nén âm thanh bị mất. May mắn thay, nén mất dữ liệu đã trở nên tốt trong những năm gần đây đến nỗi hầu hết mọi người không thể phân biệt được sự khác biệt giữa nén mất dữ liệu và nén không mất dữ liệu. Các định dạng này bao gồm MP3, OGA, AAC.

Hy vọng sau bài viết toàn tập về các loại định dạng âm thanh phổ biến nhất hiện nay sẽ giúp bạn hiểu rõ hơn về thế giới âm thanh hiện tại và hỗ trợ bạn trong việc lựa chọn những loại file âm thanh phụ hợp nhất với bạn.