dòng chảy :: hoạt động :: Conv2D

#include <nn_ops.h>

Tính toán tích chập 2-D cho input 4-D và filter căng.

Tóm lược

Đưa ra một tensor đầu vào của shape [batch, in_height, in_width, in_channels] và một tensor bộ lọc / kernel có hình dạng [filter_height, filter_width, in_channels, out_channels] , op này thực hiện như sau:

  1. Làm phẳng bộ lọc thành ma trận 2-D có hình dạng [filter_height * filter_width * in_channels, output_channels] .
  2. Trích xuất các bản vá hình ảnh từ tensor đầu vào để tạo thành tensor ảo của hình dạng [batch, out_height, out_width, filter_height * filter_width * in_channels] .
  3. Đối với mỗi bản vá, nhân phải ma trận bộ lọc và vectơ bản vá hình ảnh.

Chi tiết, với định dạng NHWC mặc định,

output[b, i, j, k] =
    sum_{di, dj, q} input[b, strides[1] * i + di, strides[2] * j + dj, q] *
                    filter[di, dj, q, k]

Phải có strides[0] = strides[3] = 1 . Đối với trường hợp phổ biến nhất của các bước ngang và đỉnh giống nhau strides = [1, stride, stride, 1] .

Tranh luận:

  • phạm vi: Một đối tượng Phạm vi
  • đầu vào: Một tensor 4-D. Thứ tự thứ nguyên được diễn giải theo giá trị của data_format , xem chi tiết bên dưới.
  • bộ lọc: Hàng [filter_height, filter_width, in_channels, out_channels] hình dạng 4-D [filter_height, filter_width, in_channels, out_channels]
  • sải bước: độ dài 1-D của chiều dài 4. Sải chân của cửa sổ trượt cho mỗi kích thước input . Thứ tự thứ nguyên được xác định bởi giá trị của data_format , xem chi tiết bên dưới.
  • padding: Loại thuật toán đệm sẽ sử dụng.

Các thuộc tính tùy chọn (xem Phần Attrs ):

  • explicit_paddings: Nếu padding"EXPLICIT" , danh sách các số lượng padding rõ ràng. Đối với thứ nguyên thứ i, lượng đệm được chèn trước và sau thứ nguyên tương ứng là explicit_paddings[2 * i]explicit_paddings[2 * i + 1] . Nếu padding không phải là "EXPLICIT" , thì explicit_paddings phải trống.
  • data_format: Chỉ định định dạng dữ liệu của dữ liệu đầu vào và đầu ra. Với định dạng mặc định "NHWC", dữ liệu được lưu trữ theo thứ tự: [hàng loạt, chiều cao, chiều rộng, kênh]. Ngoài ra, định dạng có thể là "NCHW", thứ tự lưu trữ dữ liệu của: [lô, kênh, chiều cao, chiều rộng].
  • độ giãn: độ dài 1-D của chiều dài 4. Hệ số giãn nở cho mỗi kích thước input . Nếu được đặt thành k> 1, sẽ có k-1 ô bị bỏ qua giữa mỗi phần tử bộ lọc trên thứ nguyên đó. Thứ tự thứ nguyên được xác định bởi giá trị của data_format , xem chi tiết ở trên. Độ loãng trong lô và kích thước chiều sâu phải bằng 1.

Lợi nhuận:

  • Output : Một tensor 4-D. Thứ tự thứ nguyên được xác định bởi giá trị của data_format , xem chi tiết bên dưới.

Người xây dựng và Người phá hủy

Conv2D (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input filter, const gtl::ArraySlice< int > & strides, StringPiece padding)
Conv2D (const :: tensorflow::Scope & scope, :: tensorflow::Input input, :: tensorflow::Input filter, const gtl::ArraySlice< int > & strides, StringPiece padding, const Conv2D::Attrs & attrs)

Thuộc tính công khai

operation
output

Chức năng công cộng

node () const
::tensorflow::Node *
operator::tensorflow::Input () const
operator::tensorflow::Output () const

Các chức năng tĩnh công khai

DataFormat (StringPiece x)
Dilations (const gtl::ArraySlice< int > & x)
ExplicitPaddings (const gtl::ArraySlice< int > & x)
UseCudnnOnGpu (bool x)

Cấu trúc

tensorflow :: ops :: Conv2D :: Attrs

Bộ thiết lập thuộc tính tùy chọn cho Conv2D .

Thuộc tính công khai

hoạt động

Operation operation

đầu ra

::tensorflow::Output output

Chức năng công cộng

Conv2D

 Conv2D(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input filter,
  const gtl::ArraySlice< int > & strides,
  StringPiece padding
)

Conv2D

 Conv2D(
  const ::tensorflow::Scope & scope,
  ::tensorflow::Input input,
  ::tensorflow::Input filter,
  const gtl::ArraySlice< int > & strides,
  StringPiece padding,
  const Conv2D::Attrs & attrs
)

nút

::tensorflow::Node * node() const 

toán tử :: tensorflow :: Đầu vào

 operator::tensorflow::Input() const 

toán tử :: tensorflow :: Đầu ra

 operator::tensorflow::Output() const 

Các chức năng tĩnh công khai

DataFormat

Attrs DataFormat(
  StringPiece x
)

Pha loãng

Attrs Dilations(
  const gtl::ArraySlice< int > & x
)

ExplicitPaddings

Attrs ExplicitPaddings(
  const gtl::ArraySlice< int > & x
)

UseCudnnOnGpu

Attrs UseCudnnOnGpu(
  bool x
)