教你屏蔽网通/联通的“域名纠..

用编程的方式根据对象模型很容易实现在Word、Excel文档中搜索文本,在PowERPoint里面也同样如此,使用对象模型有助于我们了解Office的文档结构。 

  搜索的思路和方法基本是相同的,用PowerPoint应用程式对象打开指定的文档,用文档对象获取文档,再使用合适的对象将文档分割成搜索范围适中的对象进行搜索。 

  打开PowerPoint的VBA帮助文档VBAPP10.CHM,根据对象模型图,很容易找到我们需要的几个集合和对象:Application、Presentations、Presentation、Slides、Slide、TextFrame、TextRange。其中Presentation代表一个 PowerPoint 文档,Slide表示PowerPoint文档中的单张幻灯片,TextFrame是幻灯片上的文本框,TextRange是文本框中的文本。 

  打开PowerPoint文档: 

string filename=""; 

PowerPoint.Application pa=new PowerPoint.ApplicationClass(); 
PowerPoint.Presentation pp=pa.Presentations.Open(filename, 
Microsoft.Office.Core.MsoTriState.msoTrue, 
Microsoft.Office.Core.MsoTriState.msoFalse, 
Microsoft.Office.Core.MsoTriState.msoFalse); 
  Open()方法的第三个参数在帮助文档中的说明如下: 

  Untitled 可选。MsoTriState 类型。指定文档是否有标题。 

  因为是Untitled,所以按照上面的代码,打开文档之后才能引用PowerPoint文档的标题,假如不想使用标题,就要把枚举msoFalse改成msoTrue。 
搜索文本: 

string[] strKeyWordList={}; //要搜索的文本 
PowerPoint.TextRange oText; 
foreach(PowerPoint.Slide slide in pp.Slides) 

foreach(PowerPoint.Shape shape in slide.Shapes) 

foreach(string strKeyWord in strKeyWordList) 

oText=null; 
oText=shape.TextFrame.TextRange.Find(strKeyWord,0,Microsoft.Office.Core.MsoTriState.msoFalse,Microsoft.Office.Core.MsoTriState.msoTrue); 
if (oText!=null) 

MessageBox.Show("文档中包含指定的关键字 " strKeyWord " !","搜索结果",MessageBoxButtons.OK); 
continue; 



}

当用wps提供的com时,程序也是类似的,如下程序得到ppt文本内容:

objPresSet = application.Presentations;
objPres = objPresSet.Open(sourceFilePath, "", KsoTriState.ksoFalse, KsoTriState.ksoCTrue, KsoTriState.ksoFalse);
foreach (Slide sld in objPres.Slides)
{
foreach (WPP.Shape sp in sld.Shapes)
{
fileText+= sp.TextFrame.TextRange.Text;
}
}

 

excel文档示例:

 ET.ApplicationClass application = null;
                    ET.workbook book = null;
                    try
                    {
                        application = new ET.ApplicationClass();
                        book = (ET.workbook)application.Workbooks.Open(sourceFilePath, type, type, type, type, type, type, type, type, type, type, type, type);
                        foreach (ET.Worksheet wk in book.Worksheets)
                        {
                            foreach (ET.Range  s in wk.UsedRange)
                            {
                               fileText += s.Text;
                            }
                        }
                        book.ExportPdf(pdfpath, "", "");//this.GetFilePath(path)是获取文件路径+文件名(不含后缀)
                    }

 

word最简单了:
WPS.ApplicationClass application = null;
                    _Document doc = null;
                    try
                    {
                        application = new WPS.ApplicationClass();
                        doc = application.Documents.Open(sourceFilePath,false,false,false,"","",false,"","",1,1,true,false,1,true);
                        fileText = doc.Content.PlainText;
                        doc.ExportPdf(pdfpath,"","");
                    }