PHP操作DOMDocument和DOMXPath示例代码代替JS玩转DOM树的思路

分类：PHP_Python| 发布：佚名| 查看： | 发表时间：2014/7/29

最近有一个需求，我需要把一个导航页的数据整理好写入数据库。一个比较直观的方法是对html文件进行分析，通用的方法是用php的正则表达式来匹配。但是这样做开发和维护都很困难，代码可读性非常差。

导航页的数据都是规则的排列在DOM树当中的，用JS可以用几个循环轻松的对其进行操作，而且JS需要依赖浏览器，操作数据库很困难。其实PHP就有现成的类库对DOM树种的节点进行增删改查操作，在此做一些笔记。

这里涉及到2个类 DOMDocument 和 DOMXPath。

其实思路比较明确，就是通过DOMDocument将一个html file转换成DOM树的数据结构，再用DOMXPath的实例去搜索这个DOM树，拿到想要特定节点，接下来就可以对当前节点的子树进行遍历，得到想要的结果。

在当前目录下有一个这样一个导航的html文件 "./hao.html"

现在需要得到所有<a>标签的中文内容，php代码如下：

代码如下:

<?php 
//将html/xml文件转换成DOM树 
$dom = new DOMDocument(); 
$dom->loadHTMLFile("hao.html"); 

//得到所有class为fix的dl标签 

// example 1: for everything with an id 
//$elements = $xpath->query("//*[@id]"); 

// example 2: for node data in a selected id 
//$elements = $xpath->query("/html/body/div[@id='yourTagIdHere']"); 

// example 3: same as above with wildcard 
//$elements = $xpath->query("*/div[@id='yourTagIdHere']"); 
$xpath = new DOMXPath($dom); 
$dls = $xpath->query('//dl[@class="fix"]'); 

foreach ($dls as $dl) { 
$spans = $dl->childNodes; 
foreach ($spans as $span) { 
echo trim($span->textContent)."\t"; 
} 
echo "\n"; 
} 
?>

输出结果如下：

注意：值得注意的一点是DOMDocument的默认编码方式是Latin，所以在处理utf编码的中文的时候，需要在<head>后面紧跟着填入

代码如下:

<meta http-equiv="content-type" content="text/html; charset=utf-8">

在其他位置，或者是只写上<meta content="charset=utf-8">都是不识别的哦

365据说看到好文章不转的人，服务器容易宕机！

标签：DOM

原创文章如转载，请注明：转载自郑州网建-前端开发　http://camnpr.com/
本文链接：http://camnpr.com/php-python/1535.html

js 添加DOM节点示例(2014-7-17 15:49:14)
js createDocumentFragment：更快捷的操作DOM的途径代码高亮库就是用的这个(2014-5-4 11:24:25)
js和jQuery获取父元素,删除子元素的两种不同方法(2014-1-20 16:14:13)
js与jQuery获取父级元素,子级元素,兄弟元素的实现方法(2014-1-20 15:18:0)
jQuery动态添加、删除元素DOM的方法(2014-1-20 11:46:52)
详解标准W3C盒子模型和IE的css盒子模型(2013-11-26 17:40:9)
js获取DOM高度 offsetHeight offsetWidth(2013-8-27 16:52:53)
复制input 包含手动输入的值(2013-7-8 10:49:46)
父页面调用iframe里的js函数(contentWindow)和dom元素(contentDocument)(2013-4-3 18:6:18)
DOM操作——怎样添加、移除、移动、复制、创建和查找节点(2012-10-24 10:51:50)

PHP操作DOMDocument和DOMXPath示例代码代替JS玩转DOM树的思路

相关文章

关注本站

一条新消息

小编推荐

热门文章

想你所想爱你所爱

PHP操作DOMDocument和DOMXPath示例代码 代替JS玩转DOM树的思路

相关文章

关注本站

一条新消息

小编推荐

热门文章

想你所想 爱你所爱

PHP操作DOMDocument和DOMXPath示例代码代替JS玩转DOM树的思路

想你所想爱你所爱