# 本节是关于集合的使用,例子全部来源与《Python数据科学指南》一书,作者Gopi, 翻译:方延风
# 集合
# 初始化两个句子
st_1= 'dogs chase cats'
st_2= 'dogs hate cats'
# 从字符串中创建词的集合
st_1_word= set(st_1.split())#set为创建结合
st_2_word= set(st_2.split())#按照某一字符串进行分割
# print(st_1_word)
# 找出集合中不重复的次的总数
no_words_st_1= len(st_1_word)
no_words_st_2= len(st_2_word)
# print(no_words_st_1)
# 其实是做两个集合的交集
cmn_words= st_1_word.intersection(st_2_word)
no_cmn_words= len(cmn_words)
# print(cmn_words)
# print(no_cmn_words)
# 找出两个集合不重复的词,其实是做并集
unq_words= st_1_word.union(st_2_word)
no_unq_words= len(unq_words)
# print(no_unq_words)
# print(unq_words)
similarity= no_cmn_words/ (1.0 * no_unq_words)
print(similarity)
# 例子
a= (1,2,1)#此处是一个元组
b= [1,2,1]#此处是一个列表
aa= set(a)
bb= set(b)
# 集合的涵义莫过于此
print(aa)
print(bb)
网友评论