TensorFlow编程概念
译者: Jack Wu
翻译自: https://colab.research.google.com/notebooks/mlcc/tensorflow_programming_concepts.ipynb
学习目标:
- 了解TensorFlow编程模型的基础知识,重点关注以下概念:
- 张量(tensor)
- 操作(operation)
- 图(graph)
- 会话(session)
- 构建一个简单的TensorFlow程序,这个程序包括一个默认的图和运行图的会话
注意: TensorFlow编程模型可能与您遇到的其他模型不同,因此可能不像您期望的那样直观。
概念概述
TensorFlow的名字来自张量,它是任意维度的数组。使用TensorFlow,您可以操纵具有非常多维度的张量。也就是说,大多数情况下,您将使用以下一个或多个低维张量:
- 标量(scalar)是一个0维数组(0阶张量)。例如,“Howdy”或“5”
-
向量(vector)是一个1维数组(1阶张量)。例如,
[2,3,5,7,11]
或[5]
-
矩阵(matrix)是一个2维数组(2阶张量)。例如,
[[3.1,8.2,5.9] [4.3,-2.7,6.5]]
TensorFlow的operations创建、销毁和操纵tensors。典型的TensorFlow程序中的大多数代码行都是operations。
TensorFlow的graph(也称为计算图或数据流图)是图数据结构。Graph的节点(node)是operations(在TensorFlow中,每个operation都与graph相关联)。许多TensorFlow程序由单个graph组成,但TensorFlow程序可以选择创建多个graphs。graph的节点是operations;图的边是tensors。Tensors流经graph,通过operation在每个节点处被操纵处理。一个operation的输出tensor通常成为后续operation的输入tensor。TensorFlow实现了延迟执行模型(lazy execution model),意味着,基于关联节点的需求,某个结点仅在需要时才被计算。
Tensor可以作为常量(constant)或变量(variable)存储在graph中。常量持有一个值不可变的tensor,而变量持有一个值可变的tensor。其实,常量和变量也是graph中的operation。常量是始终返回相同张量值的operation。变量也是一个operation,它返回赋值给它的tensor。
要定义常量,使用tf.constant
运算符并传入其值。例如:
x = tf.constant(5.2)
同样,您可以创建一个这样的变量:
y = tf.Variable([5])
或者您可以先创建变量,然后再给它赋值,像这样(请注意,您始终必须指定一个默认值):
y = tf.Variable([0])
y = y.assign([5])
一旦定义了一些常量或变量,就可以将它们与tf.add
等其他operation结合起来。当对tf.add
operation求值时,它将调用tf.constant
或tf.Variable
operation,以获取它们的值,然后返回求和后的新tensor。
Graph必须在TensorFlow session中运行,该session保存它运行的graph的状态:
with tf.Session() as sess:
initialization = tf.global_variables_initializer()
print(y.eval())
使用tf.Variable
,您必须在session开始时调用tf.global_variables_initializer
来显式初始化它们,如上所示。
注意:session可以跨多台机器来分发graph的执行(假设程序在某个分布式计算框架上运行)。有关更多信息,请参阅Distributed TensorFlow。
摘要
TensorFlow编程基本上分为两步:
- 将constant,variable和operation组合到graph中。
- 在session中对constant、variable和operation进行求值。
创建一个简单的TensorFlow程序
让我们看看如何编写一个简单的TensorFlow程序来对两个constant进行相加。
提供import语句
与几乎所有Python程序一样,您将首先指定一些import
语句。
运行TensorFlow程序所需的import
语句集取决于程序将访问的功能。至少,您必须在所有TensorFlow程序中提供import tensorflow
语句:
import tensorflow as tf
不要忘记执行前面的代码块(import
语句)。
其他常见的import语句包括以下内容:
import matplotlib.pyplot as plt # Dataset可视化。
import numpy as np # 低级Python数值计算库。
import pandas as pd # 高级Python数值计算库。
TensorFlow提供默认的graph。但是,我们建议明确创建自己的Graph
以便于跟踪状态(例如,您可能希望在每个单元格(cell)中使用不同的Graph
)。
from __future__ import print_function
import tensorflow as tf
# Create a graph.
g = tf.Graph()
# 将此graph建立为“默认”graph。
with g.as_default():
# 编排由以下三个operation组成的graph:
# * 两个用于创建操作数(operand)的tf.constant operation。
# * 一个tf.add operation 用来相加两个operand。
x = tf.constant(8, name="x_const")
y = tf.constant(5, name="y_const")
my_sum = tf.add(x, y, name="x_y_sum")
# 现在创建一个session。
# session将运行默认的graph。
with tf.Session() as sess:
print(my_sum.eval())
练习:引进第三个operand
修改上面的代码清单,相加三个整数,而不是两个:
- 定义第三个标量(scalar)整数constant
z
,并为其赋值“4”。 - 将
z
添加到my_sum
以产生新的和。
提示:有关其功能签名的更多详细信息,请参阅tf.add()的API文档。
- 重新运行修改后的代码块。程序是否生成了正确的和?
解决方案
# 创建图表。
g = tf.Graph()
# 将我们的graph设为“默认”的graph。
with g.as_default():
# 组装由三个operation组成的graph。
#(在graph中创建tensor。)
x = tf.constant(8, name="x_const")
y = tf.constant(5, name="y_const")
my_sum = tf.add(x, y, name="x_y_sum")
# 任务1:定义第三个scalar整数constant z。
z = tf.constant(4, name="z_const")
# 任务2:将z添加到`my_sum`以产生新的和。
new_sum = tf.add(my_sum, z, name="x_y_z_sum")
# 现在创建一个session。
# session将运行默认graph。
with tf.Session() as sess:
# 任务3:确保程序产生正确的总和。
print(new_sum.eval())
更多的信息
要进一步探索基本的TensorFlow graph,请尝试以下教程:
网友评论