美文网首页
C# 读取文件内容

C# 读取文件内容

作者: 过桥 | 来源:发表于2015-09-11 14:37 被阅读494次

实现效果

doc、docx、txt 文件内容检索

代码示例

添加第三方内库

Aspose.Words.dll

读取文件

上传文件时,将文件内容读取成字符串存储

/// 读文件
/// </summary>
/// <param name="officeByte">文件内容</param>
/// <param name="fileType">.doc / .docx / .txt</param>
/// <returns>文件内容</returns>
public string ReadFile(byte[] officeByte, string fileType)
{
    try
    {
        string content = "文件格式不支持检索";

        Stream stream = new MemoryStream(officeByte);
        Aspose.Words.Document doc = new Aspose.Words.Document(stream);

        if (fileType == ".doc" || fileType == ".docx")
        {
            string filePath = HttpContext.Current.Server.MapPath("SingleTable\\upfiles\\temp.doc");
            doc.Save(filePath, Aspose.Words.SaveFormat.Doc);
            content = doc.GetText();
        }
        else if (fileType == ".txt")
        {
            string filePath = HttpContext.Current.Server.MapPath("SingleTable\\upfiles\\temp.txt");
            doc.Save(filePath, Aspose.Words.SaveFormat.Text);
            StreamReader sr = new StreamReader(filePath, GetEncoding(filePath));
            content = sr.ReadToEnd().ToString();
            sr.Close();
        }
        return content;
    }
    catch (Exception e)
    {
        return "对不起,本文没有发现!可能是从服务器上删除的。";
    }
}

/// 读文件
/// </summary>
/// <param name="filePath">文件路径</param>
/// <param name="fileType">.doc / .docx / .txt</param>
/// <returns>文件内容</returns>
public string ReadFile(string filePath, string fileType)
{
    try
    {
        string content = "文件格式不支持检索";
        filePath = HttpContext.Current.Server.MapPath(filePath);
        if (fileType == ".doc" || fileType == ".docx")
        {
            Aspose.Words.Document doc = new Aspose.Words.Document(filePath);
            content = doc.GetText();
        }
        else if (filePath == ".txt")
        {
            StreamReader sr = new StreamReader(filePath, GetEncoding(filePath));
            content = sr.ReadToEnd().ToString();
            sr.Close();
        }
        return content;
    }
    catch (Exception e)
    {
        return "对不起,本文没有发现!可能是从服务器上删除的。";
    }
}

组合查询条件(空格分词)

string strFieldValue = data_fieldValue[j].ToString().Trim();
strFieldValue = Regex.Replace(strFieldValue, @"\s+", " ");

message.Append(" ( ");
foreach (string strValue in strFieldValue.Split(' '))
{
    message.Append(" fileName like '%" + strValue + "%' or");
}
message.Remove(message.Length - 2, 2);
message.Append(" ) and");

注意事项

乱码

Txt 默认格式为 ANSI,读取会出现乱码,Unicode、UTF-8 均正常。

分词

全文检索分词可使用第三方分词实现,再加上搜索热度......

相关文章

  • C# 读取文件内容

    实现效果 doc、docx、txt 文件内容检索 代码示例 添加第三方内库 读取文件 上传文件时,将文件内容读取成...

  • python3 读取文本文件

    读取文件内容 读取目录下所有文件的内容

  • Java读取文件方法汇总

    这篇文章主要为大家详细介绍了Java读取文件方法,按字节读取文件内容、按字符读取文件内容、随机读取文件内容等,具有...

  • Java读取文件方法汇总

    这篇文章主要为大家详细介绍了Java读取文件方法,按字节读取文件内容、按字符读取文件内容、随机读取文件内容等,具有...

  • unity3D c# 发送字符串到oc

    .mm 文件内容 }对应c#内容

  • C# 使用ExcelDataReader读取Excel文件内容

    存在很多优秀的操作Excel文件的库,本次使用ExcelDataReader 库读取Excel中的内容。感觉这个库...

  • Go语言之文件读取与终端读取

    从文件一次性读取全部数据 直接读取文件全部内容 逐行读取文件内容 从标准输入读取数据

  • C#读取文件

    C#获取当前路径的方法 获取包含清单的已加载文件的路径或 UNC 位置public static string s...

  • RandomAccessFile读写文件

    RandomAccessFile同时具备读写文件的能力 读取文件内容 对于读取整个文件内容的需求,它提供将文件内容...

  • 读取文件

    /** * 读取txt文件的内容 * @param file 想要读取的文件对象 * @retu...

网友评论

      本文标题:C# 读取文件内容

      本文链接:https://www.haomeiwen.com/subject/cippcttx.html