构建知识图谱
第一步是加载我们的数据。在此示例中,我们将从头开始创建一个简单的 KG。让我们首先使用我们感兴趣的数据创建一个数据框。
import pandas as pd
# Define the heads, relations, and tails
head = ['drugA', 'drugB', 'drugC', 'drugD', 'drugA', 'drugC', 'drugD', 'drugE', 'gene1', 'gene2','gene3', 'gene4', 'gene50', 'gene2', 'gene3', 'gene4']
relation = ['treats', 'treats', 'treats', 'treats', 'inhibits', 'inhibits', 'inhibits', 'inhibits', 'associated', 'associated', 'associated', 'associated', 'associated', 'interacts', 'interacts', 'interacts']
tail = ['fever', 'hepatitis', 'bleeding', 'pain', 'gene1', 'gene2', 'gene4', 'gene20', 'obesity', 'heart_attack', 'hepatitis', 'bleeding', 'cancer', 'gene1', 'gene20', 'gene50']
# Create a dataframe
df = pd.DataFrame({'head': head, 'relation': relation, 'tail': tail})
df
image.png
接下来,我们创建一个 NetworkX 图 ( G) 来表示 KG。DataFrame ( df) 中的每一行对应于 KG 中的一个三元组(头、关系、尾)。该add_edge函数在头实体和尾实体之间添加边,并以关系作为标签。
网友评论