Giới thiệu về dữ liệu đa phương tiện và cơ sở dữ liệu đa phương tiện

Dữ liệu đa phương tiện là gì

Trong nhiều năm gần đây, thuật ngữ đa phương tiện ngày càng được sử dụng nhiều hơn và rộng rãi hơn. Việc nghiên cứu và phát triển đa phương tiện là cần thiết trong ứng dụng truyền thông và thể hiện thông tin đa phương tiện. Ngày càng nhiều dữ liệu số đa phương tiện được thể hiện dưới dạng hình ảnh, video, âm thanh… đòi hỏi các kĩ thuật lưu trữ, tìm kiếm hiệu quả và mạnh mẽ hơn để khai thác và sử dụng. Nhưng trước tiên ta cần phải biết dữ liệu đa phương tiện và cơ sở dữ liệu đa phương tiện là gì? Giới thiệu về dữ liệu đa phương tiện và cơ sở dữ liệu đa phương tiện

Khái niệm dữ liệu đa phương tiện

Định nghĩa: Phương tiện được thiết kế để được sử dụng cho các loại thông tin hoặc biểu diễn thông tin, chẳng hạn như dữ liệu kỹ thuật số, văn bản, hình ảnh, âm thanh, video.

Đa phương tiện là một tập hợp các loại phương tiện được sử dụng cùng nhau. Nó cũng ngầm nhận dạng các kiểu dữ liệu không phải là số và văn bản. Do đó, thuật ngữ “đa phương tiện” cũng lấy thuộc tính làm tính từ. Đa phương tiện cũng có thể hiểu đơn giản là sự kết hợp của văn bản, hình ảnh, hình ảnh động, âm thanh và video. Đa phương tiện tồn tại trong tất cả các khía cạnh của hoạt động và cuộc sống của con người, chẳng hạn như truyền thông, giải trí, kinh doanh, giáo dục …

Dữ liệu đa phương tiện là dữ liệu cho các bản trình bày có thể đọc được bằng máy của các loại phương tiện tổng hợp.

Đặc điểm của dữ liệu đa phương tiện:

  • Công suất lớn
  • Đa dạng, không có cấu trúc

Tìm kiếm dữ liệu theo loại câu hỏi cũng rất đa dạng, ví dụ:

  • Tìm kiếm theo Nội dung: Tìm kiếm ảnh có hồ nước?
  • Tìm kiếm theo Mẫu tính năng: Tìm kiếm các bài hát có “nhạc mẫu”
  • Tìm kiếm theo Yếu tố dữ liệu: Tìm kiếm một người tên là Hồ Chí Minh?

Dữ liệu đa phương tiện thường gắn liền với các vấn đề bản quyền – quyền sở hữu trí tuệ trong các sản phẩm và dữ liệu. Các lĩnh vực có bản quyền trên thế giới bao gồm: phần mềm, âm nhạc, điện ảnh, văn học, sân khấu, kiến ​​trúc, mô hình thiên nhiên, nhiếp ảnh, nghệ thuật (hội họa, đồ họa, điêu khắc…).

Dữ liệu đa phương tiện và các thuộc tính của nó

Tất cả dữ liệu âm thanh và hình ảnh, hình ảnh đều không thể tránh khỏi. Xu hướng sử dụng dữ liệu đa phương tiện khiến công nghệ lưu trữ số phát triển nhanh hơn và có thể dễ dàng đáp ứng nhu cầu đa phương tiện nhỏ. Nhưng đối với các yêu cầu toàn diện, cần tổ chức dữ liệu trên toàn hệ thống và tìm kiếm nhanh hơn.

Khái niệm sử dụng đa phương tiện – máy bay bay qua ngưỡng âm thanh

Mọi người không chỉ phải đối mặt với áp lực về khối lượng dữ liệu mà còn phải đối mặt với nhiều loại dữ liệu và thuộc tính khác với dữ liệu dạng số và dạng văn bản truyền thống. Dữ liệu đa phương tiện cũng có các thuộc tính chính sau:

  • Dữ liệu media, đặc biệt là dữ liệu âm thanh và video, là dữ liệu nén tốc độ cao, khoảng 1gb chỉ chứa được khoảng 10 phút video.
  • Âm thanh và video dữ liệu có kích thước tạm thời và yêu cầu tốc độ biểu đạt cố định để đạt được hiệu quả mong muốn.
  • Dữ liệu âm thanh, hình ảnh và video kỹ thuật số được thể hiện ở nhiều định dạng khác nhau. các mẫu riêng của chúng, do đó rất khó để tự động xác định nội dung vì không dễ xác định cấu trúc ngữ nghĩa của chúng.
  • Nhiều ứng dụng đa phương tiện cần đại diện đồng thời nhiều loại phương tiện theo cách này. Tương ứng với không gian và thời gian.
  • Ý nghĩa của dữ liệu đa phương tiện thường mơ hồ và mang tính chủ quan, không thể xác định rõ ràng.
  • Dữ liệu đa phương tiện mang nhiều thông tin và yêu cầu nhiều tham số biểu diễn nội dung.

Giới thiệu về dữ liệu đa phương tiện và cơ sở dữ liệu đa phương tiện

Ví dụ về hoạt ảnh được tạo từ các khung hình trên, khi nhìn vào hoạt ảnh, chúng ta có thể dễ dàng nhận thấy quả bóng đang nảy và nên rơi xuống. Nhưng rất khó nắm bắt tự động nội dung của ảnh động.

Cơ sở dữ liệu phương tiện

media csdl = csdl + đa phương tiện

Có nhiều định nghĩa khác nhau về cơ sở dữ liệu đa phương tiện: Theo eurescom, cơ sở dữ liệu đa phương tiện là cơ sở dữ liệu hiệu suất cao, dung lượng cao có khả năng hỗ trợ các kiểu dữ liệu và đa phương tiện. Các kiểu dữ liệu chữ và số cơ bản khác, có thể xử lý lượng lớn thông tin đa phương tiện.

Từ quan điểm trên, chúng ta có thể thấy rằng cơ sở dữ liệu đa phương tiện bao gồm năm mục tiêu chính sau:

  • Hỗ trợ các kiểu dữ liệu đa phương tiện (kiểu = cấu trúc + phép toán): các tiện ích khác nhau và các thao tác thông thường, cũng như các thao tác đặc biệt mà các kiểu dữ liệu thông thường không có, chẳng hạn như tiến, lùi, dừng … >
  • Có thể Quản lý một số lượng lớn các đối tượng đa phương tiện: đề cập đến không gian lưu trữ của csdl.
  • Hỗ trợ quản lý dung lượng lớn, dung lượng lớn và hiệu quả với hiệu suất cao.
  • Có khả năng sử dụng các hệ thống cơ sở dữ liệu truyền thống.
  • Có thể truy cập thông tin đa phương tiện.

Cơ sở dữ liệu đa phương tiện khác với cơ sở dữ liệu truyền thống (cơ sở dữ liệu quan hệ). Các kiểu dữ liệu khác nhau trong cơ sở dữ liệu đa phương tiện yêu cầu các phương pháp tiếp cận đặc biệt để tối ưu hóa lưu trữ, truy cập, lập chỉ mục và khai thác. Do đó, các hệ quản trị cơ sở dữ liệu đa phương tiện (mdbms) phải đáp ứng các yêu cầu đặc biệt này bằng cách cung cấp các cơ chế trừu tượng mức cao để quản lý các kiểu dữ liệu khác nhau và các giao diện thích hợp để đại diện cho chúng. cho họ thấy đi.

mdbms trước tiên phải hỗ trợ nhiều loại dữ liệu đa phương tiện, ngoài việc cung cấp đầy đủ chức năng của dbms truyền thống, chẳng hạn như khai báo và tạo cơ sở dữ liệu, truy vấn và tổ chức dữ liệu, độc lập, bảo mật, toàn vẹn dữ liệu và lập phiên bản.

Cấu trúc lưu trữ cơ sở dữ liệu phương tiện

Giới thiệu về dữ liệu đa phương tiện và cơ sở dữ liệu đa phương tiện Mô hình dữ liệu đa phương tiện

Khi nói đến cấu trúc dữ liệu đa phương tiện, điều đầu tiên cần chú ý là dữ liệu phương tiện luôn có cả khía cạnh không gian và thời gian. Không gian của dữ liệu đa phương tiện thường đa chiều.

Mọi người quan tâm đến việc nhận thức dữ liệu đa phương tiện và cách chính thức hóa chúng. Các khái niệm đa phương tiện cần được chính thức hóa để phát triển các ứng dụng. Hầu hết dữ liệu n chiều được biểu diễn bằng cách sử dụng phân rã cây thông tin.

Để chính thức hóa và trừu tượng hóa dữ liệu đa phương tiện, cần có các kỹ thuật như cây b, b +, k-d (k-chiều), cây tứ phân dựa trên điểm, cây tứ phân, cây r, v.v. Đồng thời, phải chú ý đến các phương pháp được sử dụng để thực hiện các kỹ thuật này.

  • Cây hai chiều được sử dụng để biểu diễn các nút trong không gian hai chiều. Cây k-d với k ≥ 2 được sử dụng cho không gian k chiều, ví dụ: điểm (x, y, z) sử dụng cây 3-d.
  • Quadtree, hoặc quadtree, được sử dụng để biểu diễn các điểm trong không gian hai chiều. Một cây 2D cũng có tác dụng tương tự. Nhưng sự khác biệt là cây tứ phân chia miền thành 4 phần, trong khi cây 2-d cho phép miền được chia thành hai phần.

Giới thiệu về dữ liệu đa phương tiện và cơ sở dữ liệu đa phương tiện

ví dụ: 4 phần của một nút trong một quadtree

  • Tạo cây miền để cho phép sử dụng cấu trúc biểu diễn dữ liệu của miền. Nó được gọi là r-tree. Ngoài các hiệu ứng hình ảnh nói trên, r-tree còn có thêm lợi ích là giữ thông tin có tổ chức trên đĩa, ít nhất là về mặt giảm số lần truy cập đĩa.

Tạo một hình chữ nhật có chứa các điểm

Có nhiều khía cạnh cần xem xét khi chọn cấu trúc dữ liệu chính xác cho một đối tượng đa phương tiện. Nhưng trong một số cấu trúc, bạn có thể chọn một cấu trúc phù hợp với kiểu dữ liệu và các tham số khác sẽ được xem xét. Cấu trúc trên sẽ không được phân tích sâu trong phần giới thiệu.

Tham khảo:

  • Giáo trình Cơ sở dữ liệu phương tiện – pgs.ts do trung tuan
  • Quản lý dữ liệu đa phương tiện và dữ liệu phi cấu trúc trong cơ sở dữ liệu oracle – marcelle kratochvil