Google Cloud Vision API - Dịch vụ phân tích hình ảnh mạnh mẽ cho lập trình viên



Mỗi ngày một chia sẻ - Google Cloud Vision API là dịch vụ phân tích ảnh mạnh mẽ cho các lập trình viên với nhiều tính năng hữu ích. Ứng dụng này hiện đã được mở cửa tự do cho người dùng thử nghiệm.

Giới thiệu

Google Cloud Vision API là dịch vụ phân tích ảnh mạnh mẽ cho các lập trình viên với nhiều tính năng hữu ích. Ứng dụng này hiện đã được mở cửa tự do cho người dùng thử nghiệm.

Google Cloud Vision API

Google Cloud Vision API có thể làm gì?

Phân tích hình ảnh mạnh mẽ

Google Cloud Vision API cho phép các nhà phát triển hiểu được nội dung của hình ảnh bằng các gói mô hình học tập máy móc mạnh mẽ, dễ dàng để sử dụng REST API. Nó nhanh chóng phân loại các hình ảnh vào hàng ngàn danh mục (ví dụ, thuyền buồm, sư tử, tháp Eiffel), phát hiện đối tượng cá nhân và khuôn mặt trong hình ảnh, tìm thấy và đọc chữ in trong ảnh. Bạn có thể xây dựng siêu dữ liệu trong danh mục hình ảnh, điều tiết các nội dung phản cảm, kích hoạt các tình huống marketing mới thông qua phân tích tâm lý hình ảnh. Phân tích các hình ảnh được tải lên theo yêu cầu hoặc tích hợp với hình ảnh được lưu trữ trên Google Cloud Storage. (Trong phiên bản Beta, Google Cloud Vision API không dành cho việc sử dụng thời gian thực trên các ứng dụng quan trọng khác).

Cái nhìn sâu sắc từ hình ảnh của bạn

Dễ dàng phát hiện các đối tượng trong hình ảnh của bạn từ hoa, động vật, đến hàng ngàn loại đối tượng khác thường được tìm thấy trong hình ảnh. Google Cloud Vision API cải thiện theo thời gian khi những khái niệm mới được giới thiệu và chính thức được đưa vào.

Phát hiện nội dung không phù hợp

Với sức mạnh từ Google SafeSearch, dễ dàng điều tiết nội dung từ hình ảnh có nguồn gốc đám đông. Google Cloud Vision API cho phép bạn phát hiện những nội dung không phù hợp từ nội dung người lớn đến nội dung bạo lực.

Phân tích tâm lý hình ảnh

Google Cloud Vision API có thể phân tích các thuộc tính cảm xúc trên khuôn mặt của người xuất hiện trên ảnh, như vui, buồn, tức giận. Kết hợp điều này với phát hiện đối tượng, phát hiện logo sản phẩm, vì vậy, bạn có thể đánh giá xem mọi người cảm thấy như thế nào về một thương hiệu.

Nhận diện cảm xúc
Nhận diện cảm xúc của các khuôn mặt trong bức ảnh

Chiết xuất văn bản

Nhận dạng ký tự quang học (OCR) cho phép bạn phát hiện văn bản trong hình ảnh, cùng với khả năng nhận dạng ngôn ngữ tự động. Google Cloud Vision API hỗ trợ một tập hợp rộng các ngôn ngữ.

Tính năng chính của Google Cloud Vision API

  • Phát hiện nhãn hiệu: Phát hiện một bộ các danh mục trong hình ảnh từ phương thức vận tải tới động vật.
  • Phát hiện nội dung rõ ràng: Như nội dung người lớn hoặc nội dung bạo lực trong một hình ảnh
  • Phát hiện logo: Phát hiện những logo sản phẩm phổ biến trong một hình ảnh
  • Phát hiện mốc phân giới (landmark): Phát hiện cấu trúc tự nhiên và nhân tạo phổ biến trong một hình ảnh.
  • Các thuộc tính hình ảnh: Phát hiện các thuộc tính chung của hình ảnh, chẳng hạn như màu sắc chủ đạo.
  • Nhận diện ký tự quang học: Phát hiện và trích xuất văn bản trong một hình ảnh với sự hỗ trợ nhận dạng ngôn ngữ tự động.
  • Phát hiện khuôn mặt: Phát hiện nhiều khuôn mặt trong hình ảnh, cùng với các thuộc tính quan trọng trên khuôn mặt như trạng thái cảm xúc hoặc đeo khăn trùm đầu. Facial Recognition không được hỗ trợ.
  • Tích hợp REST API: Truy cập thông qua REST API để yêu cầu một hay nhiều loại chú thích cho mỗi hình ảnh. Hình ảnh có thể được tải lên theo yêu cầu hoặc tích hợp với Google Cloud Storage.

Video giới thiệu Google Cloud Vision API

Hiện tại người dùng có thể sử dụng Google Cloud Vision API miễn phí với 1000 hình ảnh đầu tiên. Mỗi 1000 hình ảnh tiếp theo sẽ được tính với một khoản chi phí cố định, gửi càng nhiều hình (ít hơn 20 triệu hình ảnh một tháng) sẽ nhận được giảm giá.

Có thể nói rằng với những tính năng phân tích nội dung hình ảnh mạnh mẽ mà Google Cloud Vision API mang lại sẽ giúp các nhà lập trình tạo ra được những sản phẩm thông minh với khả năng phân biệt được đồ vật hay thậm chí là cả cảm xúc của con người.

Bích Thủy

download.com.vn