Посмотреть на TensorFlow.org | Запустить в Google Colab | Посмотреть исходный код на GitHub | Скачать блокнот |
При работе с приложениями ML, такими как обнаружение объектов и НЛП, иногда необходимо работать с подразделами (срезами) тензоров. Например, если архитектура вашей модели включает маршрутизацию, один уровень может контролировать, какой обучающий пример будет перенаправлен на следующий уровень. В этом случае вы можете использовать операции нарезки тензоров, чтобы разделить тензоры и собрать их вместе в правильном порядке.
В приложениях НЛП вы можете использовать тензорные срезы для маскирования слов во время обучения. Например, вы можете сгенерировать обучающие данные из списка предложений, выбрав индекс слова для маскирования в каждом предложении, выбрав слово в качестве метки, а затем заменив выбранное слово токеном маски.
В этом руководстве вы узнаете, как использовать API-интерфейсы TensorFlow для:
- Извлечь срезы из тензора
- Вставьте данные по определенным индексам в тензор
Это руководство предполагает знакомство с тензорной индексацией. Прочтите разделы об индексации руководств Tensor и TensorFlow NumPy , прежде чем приступить к работе с этим руководством.
Настраивать
import tensorflow as tf
import numpy as np
Извлечение тензорных срезов
Выполните тензорную нарезку в стиле NumPy, используя tf.slice
.
t1 = tf.constant([0, 1, 2, 3, 4, 5, 6, 7])
print(tf.slice(t1,
begin=[1],
size=[3]))
tf.Tensor([1 2 3], shape=(3,), dtype=int32)
В качестве альтернативы вы можете использовать более Pythonic синтаксис. Обратите внимание, что тензорные срезы равномерно распределены по диапазону старт-стоп.
print(t1[1:4])
tf.Tensor([1 2 3], shape=(3,), dtype=int32)
print(t1[-3:])
tf.Tensor([5 6 7], shape=(3,), dtype=int32)
Для двумерных тензоров вы можете использовать что-то вроде:
t2 = tf.constant([[0, 1, 2, 3, 4],
[5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
print(t2[:-1, 1:3])
tf.Tensor( [[ 1 2] [ 6 7] [11 12]], shape=(3, 2), dtype=int32)
Вы также можете использовать tf.slice
для многомерных тензоров.
t3 = tf.constant([[[1, 3, 5, 7],
[9, 11, 13, 15]],
[[17, 19, 21, 23],
[25, 27, 29, 31]]
])
print(tf.slice(t3,
begin=[1, 1, 0],
size=[1, 1, 2]))
tf.Tensor([[[25 27]]], shape=(1, 1, 2), dtype=int32)
Вы также можете использовать tf.strided_slice
для извлечения срезов тензоров, «шагая» по размерам тензора.
Используйте tf.gather
для извлечения конкретных индексов из одной оси тензора.
print(tf.gather(t1,
indices=[0, 3, 6]))
# This is similar to doing
t1[::3]
tf.Tensor([0 3 6], shape=(3,), dtype=int32) <tf.Tensor: shape=(3,), dtype=int32, numpy=array([0, 3, 6], dtype=int32)>
tf.gather
не требует, чтобы индексы были равномерно распределены.
alphabet = tf.constant(list('abcdefghijklmnopqrstuvwxyz'))
print(tf.gather(alphabet,
indices=[2, 0, 19, 18]))
tf.Tensor([b'c' b'a' b't' b's'], shape=(4,), dtype=string)
Чтобы извлечь срезы из нескольких осей тензора, используйте tf.gather_nd
. Это полезно, когда вы хотите собрать элементы матрицы, а не только ее строки или столбцы.
t4 = tf.constant([[0, 5],
[1, 6],
[2, 7],
[3, 8],
[4, 9]])
print(tf.gather_nd(t4,
indices=[[2], [3], [0]]))
tf.Tensor( [[2 7] [3 8] [0 5]], shape=(3, 2), dtype=int32)
t5 = np.reshape(np.arange(18), [2, 3, 3])
print(tf.gather_nd(t5,
indices=[[0, 0, 0], [1, 2, 1]]))
tf.Tensor([ 0 16], shape=(2,), dtype=int64)
# Return a list of two matrices
print(tf.gather_nd(t5,
indices=[[[0, 0], [0, 2]], [[1, 0], [1, 2]]]))
tf.Tensor( [[[ 0 1 2] [ 6 7 8]] [[ 9 10 11] [15 16 17]]], shape=(2, 2, 3), dtype=int64)
# Return one matrix
print(tf.gather_nd(t5,
indices=[[0, 0], [0, 2], [1, 0], [1, 2]]))
tf.Tensor( [[ 0 1 2] [ 6 7 8] [ 9 10 11] [15 16 17]], shape=(4, 3), dtype=int64)
Вставить данные в тензоры
Используйте tf.scatter_nd
для вставки данных в определенные срезы/индексы тензора. Обратите внимание, что тензор, в который вы вставляете значения, инициализируется нулями.
t6 = tf.constant([10])
indices = tf.constant([[1], [3], [5], [7], [9]])
data = tf.constant([2, 4, 6, 8, 10])
print(tf.scatter_nd(indices=indices,
updates=data,
shape=t6))
tf.Tensor([ 0 2 0 4 0 6 0 8 0 10], shape=(10,), dtype=int32)
Такие методы, как tf.scatter_nd
, требующие инициализации нулем тензоров, аналогичны инициализаторам разреженных тензоров. Вы можете использовать tf.gather_nd
и tf.scatter_nd
для имитации поведения разреженных тензорных операций.
Рассмотрим пример, в котором вы создаете разреженный тензор, используя эти два метода вместе.
# Gather values from one tensor by specifying indices
new_indices = tf.constant([[0, 2], [2, 1], [3, 3]])
t7 = tf.gather_nd(t2, indices=new_indices)
# Add these values into a new tensor
t8 = tf.scatter_nd(indices=new_indices, updates=t7, shape=tf.constant([4, 5]))
print(t8)
tf.Tensor( [[ 0 0 2 0 0] [ 0 0 0 0 0] [ 0 11 0 0 0] [ 0 0 0 18 0]], shape=(4, 5), dtype=int32)
Это похоже на:
t9 = tf.SparseTensor(indices=[[0, 2], [2, 1], [3, 3]],
values=[2, 11, 18],
dense_shape=[4, 5])
print(t9)
SparseTensor(indices=tf.Tensor( [[0 2] [2 1] [3 3]], shape=(3, 2), dtype=int64), values=tf.Tensor([ 2 11 18], shape=(3,), dtype=int32), dense_shape=tf.Tensor([4 5], shape=(2,), dtype=int64))
# Convert the sparse tensor into a dense tensor
t10 = tf.sparse.to_dense(t9)
print(t10)
tf.Tensor( [[ 0 0 2 0 0] [ 0 0 0 0 0] [ 0 11 0 0 0] [ 0 0 0 18 0]], shape=(4, 5), dtype=int32)
Чтобы вставить данные в тензор с уже существующими значениями, используйте tf.tensor_scatter_nd_add
.
t11 = tf.constant([[2, 7, 0],
[9, 0, 1],
[0, 3, 8]])
# Convert the tensor into a magic square by inserting numbers at appropriate indices
t12 = tf.tensor_scatter_nd_add(t11,
indices=[[0, 2], [1, 1], [2, 0]],
updates=[6, 5, 4])
print(t12)
tf.Tensor( [[2 7 6] [9 5 1] [4 3 8]], shape=(3, 3), dtype=int32)
Точно так же используйте tf.tensor_scatter_nd_sub
для вычитания значений из тензора с уже существующими значениями.
# Convert the tensor into an identity matrix
t13 = tf.tensor_scatter_nd_sub(t11,
indices=[[0, 0], [0, 1], [1, 0], [1, 1], [1, 2], [2, 1], [2, 2]],
updates=[1, 7, 9, -1, 1, 3, 7])
print(t13)
tf.Tensor( [[1 0 0] [0 1 0] [0 0 1]], shape=(3, 3), dtype=int32)
Используйте tf.tensor_scatter_nd_min
для поэлементного копирования минимальных значений из одного тензора в другой.
t14 = tf.constant([[-2, -7, 0],
[-9, 0, 1],
[0, -3, -8]])
t15 = tf.tensor_scatter_nd_min(t14,
indices=[[0, 2], [1, 1], [2, 0]],
updates=[-6, -5, -4])
print(t15)
tf.Tensor( [[-2 -7 -6] [-9 -5 1] [-4 -3 -8]], shape=(3, 3), dtype=int32)
Точно так же используйте tf.tensor_scatter_nd_max
для поэлементного копирования максимальных значений из одного тензора в другой.
t16 = tf.tensor_scatter_nd_max(t14,
indices=[[0, 2], [1, 1], [2, 0]],
updates=[6, 5, 4])
print(t16)
tf.Tensor( [[-2 -7 6] [-9 5 1] [ 4 -3 -8]], shape=(3, 3), dtype=int32)
Дополнительная литература и ресурсы
В этом руководстве вы узнали, как использовать операции нарезки тензоров, доступные в TensorFlow, для более точного управления элементами в ваших тензорах.
Ознакомьтесь с операциями нарезки, доступными в TensorFlow NumPy, такими как
tf.experimental.numpy.take_along_axis
иtf.experimental.numpy.take
.Также ознакомьтесь с руководством по тензорам и руководством по переменным .