美文网首页
辽经干3

辽经干3

作者: __method__ | 来源:发表于2021-04-07 11:31 被阅读0次

set and string

#set {}
# dict {:, :}
# tuple ()
# list []
# 无序不重复
a = {"1", "2", "3", 4, 4, 4}
print(a)
print(type(a))
nameset = ["张三", "李四", "李四", "李四", "李四"]
print(len(nameset))
print(nameset)
print(set(nameset))
print(len(set(nameset)))
# print(a[0]) # TypeError: 'set' object is not subscriptable

# string
#用 ‘’  “” 中包含的都是string类型
# 字符串一旦创建具有不可变行
name = "$liao, ning jingji"
print(len(name))
print(name.split())
print(name.replace(",", ";"))
print(name)
name = name.replace(",", ";")
print(name)
# 把列表变成字符串  join
ls = ["I", "am", "a", "good", "student"]
str1 = "-".join(ls)
print(str1)
str2 = " ".join(ls)
print(str2)

file io

# 文件的读取与写入
# 写入
# , mode='w'代表写入文件
s = "辽宁省沈阳市沈北新区"
f = open('hello.txt', mode='w', encoding='utf-8')
f.write(s)

#  mode='r'是读取文件
f = open('hello.txt', mode='r', encoding='utf-8')
data = f.read()
print(data)

jieba

# 中文分词技术
# 直接使用 jieba 分词就可以
# pip install jieba
import jieba
seg = "我来自北京清华大学"
print(jieba.lcut(seg))

sort

counts = {'第一回': 1, '桃园': 19, '豪杰': 22, '结义': 14, '黄巾': 40,}
# 排序
# 字典 ---》 列表
ls = list(counts.items())
# 按照 元组的第二值进行排序
ls.sort(key= lambda item :item[1], reverse=True)
print(ls)

analysis

import jieba
f = open('threekingdom.txt', mode='r', encoding='utf-8')
data = f.read()
print(len(data))
word_list = jieba.lcut(data)
print(len(word_list))
# 词频统计
counts = {}
for word in word_list:
    if len(word) <= 1:
        continue
    else:
        counts[word]=counts.get(word, 0) + 1

counts["孔明"] = counts["孔明"] + counts["孔明曰"]
counts["关公"] = counts["关公"] + counts["云长"]
counts["刘备"] = counts["刘备"] + counts["玄德曰"]+ counts["玄德"]
stop_words = {"将军", "却说", "丞相", "孔明曰", "二人", "不可","荆州","不能",
              "如此", "商议", "如何","主公", "军士", "军马", "左右", "玄德曰",
              "玄德", "云长", "次日", "引兵", "大喜", "东吴", "于是", "今日"
                , "不敢", "天下", "魏兵", "陛下", "都督"}
for word in stop_words:
    del counts[word]

ls = list(counts.items())
ls.sort(key= lambda item :item[1], reverse=True)
for name, num in ls[:10]:
    print(name, num)

相关文章

  • 辽经干3

    set and string file io jieba sort analysis

  • 辽经干python 列表(1)

    列表的常见操作 使用列表筛选 遍历了列表三种方式 切片

  • 辽经干python 元组和字典(2)

    字典 词频统计 词云

  • 镇川干炉的故事

    镇川干炉的故事 干炉,又名得胜饼。起源于宋辽时期兴盛于清代,工艺精湛,经后世传人不断潜心研究创新,制作出不同的风味...

  • 每日一分钟学会<<三字经>>(六十五)

    <一>原文: 辽与金,帝号纷。 迨灭辽,宋犹存。 <二>三字经四六句识记 契丹辽朝,女真金,辽与金。 宋朝同时,辽...

  • 经典诵读(五十三)

    《三字经》 辽与金,帝号纷。迨灭辽,宋犹存。 译文: 当时的中国北方还有辽国和金国,它们各有好几代皇帝。后来辽国被...

  • 查干湖春猎考

    昨日看新闻,看到查干湖冬猎开始,按百度百科所言,查干湖为辽金帝王狩猎之所,辽史中又有记载为春猎之所。此处就生...

  • 戈壁沙漠,这五种味道你一定熟悉!

    敦煌戈壁,辽辽无际 人生百味,悉数尝尽 才知 创业的不易 生活的不易 戈壁“五味” 酸、甜、苦、辣、咸 速干衣在阳...

  • 穿越历史丨我被寇准坑惨了!

    背景: 自979年开始,宋辽对殴20多年谁也干不死谁,双方都累了,宋辽打了25年,每次杀个昏天黑地,除了伤敌一万自...

  • 阿辽沙 3

    阿辽沙把夺来的琉琉儿,小心地装在一个小盒子里,藏在枕头下面,晚上偷偷拿出来看。他把两个琉琉儿轻轻地碰在一起,听着那...

网友评论

      本文标题:辽经干3

      本文链接:https://www.haomeiwen.com/subject/nraykltx.html