码迷,mamicode.com
首页 > Web开发 > 详细

.net 后台读取pdf的值

时间:2016-07-20 17:43:44      阅读:263      评论:0      收藏:0      [点我收藏+]

标签:

在网上找了内容

下载了技术分享这个插件

引用在了项目中

技术分享

然后找到pdf中的位置 进行读取

  string pdfPath = Server.MapPath("~/ViewPatPdf.pdf");
                PDDocument doc = PDDocument.load(pdfPath);
                PDFTextStripper stripper = new PDFTextStripper();
                string txt = stripper.getText(doc);
                Response.Write(txt);

上面是第一种

 下面用itextsharp进行读取

下载itextsharp.dll进行引用

然后写方法

 public string ReadPdfFile(string fileName)
        {
            StringBuilder text = new StringBuilder();
            PdfReader pdfReader = new PdfReader(fileName);
            for (int page = 1; page <= pdfReader.NumberOfPages; page++)
            {
                ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
                currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
                text.Append(currentText);
            }
            pdfReader.Close();
            return text.ToString();
        }

filename也是pdf的路径

然后就可以读取出来了

这个读取pdf上面的内容,纯粹的把pdf上面的内容进行读取

.net 后台读取pdf的值

标签:

原文地址:http://www.cnblogs.com/jiangyou-lz/p/5688963.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!