@lkxed
https://linux.cn/article-14381-1.html
This commit is contained in:
Xingyu Wang 2022-03-22 09:17:08 +08:00
parent 259da41bb5
commit 1a62e86350

View File

@ -3,29 +3,31 @@
[#]: author: (Seth Kenlon https://opensource.com/users/seth)
[#]: collector: (lujun9972)
[#]: translator: (lkxed)
[#]: reviewer: ( )
[#]: publisher: ( )
[#]: url: ( )
[#]: reviewer: (wxy)
[#]: publisher: (wxy)
[#]: url: (https://linux.cn/article-14381-1.html)
使用 Java 解析 XML 文件
======
在你使用 Java 编写软件时实现持久化配置。
![Person drinking a hot drink at the computer][1]
当你编写一个应用时,你通常都会希望用户能够定制化他们和应用交互的方式,以及应用与系统进行交互的方式。这种方式通常被称为 “偏好” 或者 “设置”,它们被保存在一个 “偏好文件” 或者 “配置文件” 中,有时也直接简称为 “配置”。配置文件可以有很多种格式,包括 INI、JSON、YAML 和 XML。每一种编程语言解析这些格式的方式都不同。本文主要讨论当你在使用 [Java 编程语言][2] 来编写软件时,实现持久化配置的方式。
> 在你使用 Java 编写软件时实现持久化配置。
![](https://img.linux.net.cn/data/attachment/album/202203/22/091553wf2gvj20fn4wfgpw.jpg)
当你编写一个应用时,你通常都会希望用户能够定制化他们和应用交互的方式,以及应用与系统进行交互的方式。这种方式通常被称为 “<ruby>偏好<rt>preference</rt></ruby>” 或者 “<ruby>设置<rt>setting</rt></ruby>”,它们被保存在一个 “偏好文件” 或者 “配置文件” 中,有时也直接简称为 “<ruby>配置<rt>config</rt></ruby>”。配置文件可以有很多种格式,包括 INI、JSON、YAML 和 XML。每一种编程语言解析这些格式的方式都不同。本文主要讨论当你在使用 [Java 编程语言][2] 来编写软件时,实现持久化配置的方式。
### 选择一个格式
编写配置文件是一件相当复杂的事情。我曾经试过把配置项使用逗号分隔保存在一个文本文件里,也试过把配置项保存在非常详细的 YAML 和 XML 中。对于配置文件来说,最重要是要有一致性和规律性,它们使你可以简单快速地编写代码,从配置文件中解析出数据;同时,当用户决定要做出修改时,很方便地保存和更新配置。
目前有 [几种流行的配置文件格式][3]。对于大多数常见的配置文件格式Java 都有对应的<ruby><rt>libraries</rt></ruby>。在本文中,我将使用 XML 格式。对于一些项目,你可能会选择使用 XML因为它的一个突出特点是能够为包含的数据提供大量相关的元数据而在另外一些项目中你可能会因为 XML 的冗长而不选择它。在 Java 中使用 XML 是非常容易的,因为它默认包含了许多健壮的 XML 库。
目前有 [几种流行的配置文件格式][3]。对于大多数常见的配置文件格式Java 都有对应的<ruby><rt>library</rt></ruby>。在本文中,我将使用 XML 格式。对于一些项目,你可能会选择使用 XML因为它的一个突出特点是能够为包含的数据提供大量相关的元数据而在另外一些项目中你可能会因为 XML 的冗长而不选择它。在 Java 中使用 XML 是非常容易的,因为它默认包含了许多健壮的 XML 库。
### XML 基础
讨论 XML 可是一个大话题。我有一本关于 XML 的书,它有超过 700 页的内容。幸运的是,使用 XML 并不需要非常了解它的诸多特性。就像 HTML 一样XML 是一个带有开始和结束标记的分层标记语言,每一个标记(标签)内可以包含零个或更多数据。下面是一个 XML 的简单示例片段:
```xml
```
<xml>
  <node>
    <element>Penguin</element>
@ -35,12 +37,10 @@
在这个 <ruby>自我描述的<rt>self-descriptive</rt></ruby> 例子中XML 解析器使用了以下几个概念:
* **<ruby>文档<rt>Document</rt><ruby>**`<xml>` 标签标志着一个 _文档_ 的开始,`</xml>` 标签标志着这个文档的结束。
* **<ruby>节点<rt>Node</rt></ruby>**`<node>` 标签代表了一个 _节点_
* **<ruby>元素<rt>Element</rt></ruby>**`<element>Penguin</element>` 中,从开头的 `<` 到最后的 `>` 表示了一个 _元素_
* **<ruby>内容<rt>Content</rt></ruby>** 在 `<element>` 元素里,字符串 `Penguin` 就是 _内容_
* <ruby>文档<rt>Document</rt><ruby>`<xml>` 标签标志着一个 _文档_ 的开始,`</xml>` 标签标志着这个文档的结束。
* <ruby>节点<rt>Node</rt></ruby>`<node>` 标签代表了一个 _节点_
* <ruby>元素<rt>Element</rt></ruby>`<element>Penguin</element>` 中,从开头的 `<` 到最后的 `>` 表示了一个 _元素_
* <ruby>内容<rt>Content</rt></ruby>`<element>` 元素里,字符串 `Penguin` 就是 _内容_
不管你信不信,只要了解了以上几个概念,你就可以开始编写、解析 XML 文件了。
@ -48,8 +48,7 @@
要学习如何解析 XML 文件,只需要一个极简的示例文件就够了。假设现在有一个配置文件,里面保存的是关于一个图形界面窗口的属性:
```xml
```
<xml>
  <window>
    <theme>Dark</theme>
@ -61,8 +60,7 @@
创建一个名为 `~/.config/DemoXMLParser` 的目录:
```shell
```
$ mkdir ~/.config/DemoXMLParser
```
@ -72,21 +70,21 @@ $ mkdir ~/.config/DemoXMLParser
### 使用 Java 解析 XML
如果你是 Java 的初学者,你可以先阅读我写的 [面向 Java 入门开发者的 7 个小技巧][5]。一旦你对 Java 比较熟悉了打开你最喜爱的集成开发工具IDE创建一个新工程。我会把我的新工程命名为 **myConfigParser**
如果你是 Java 的初学者,你可以先阅读我写的 [面向 Java 入门开发者的 7 个小技巧][5]。一旦你对 Java 比较熟悉了打开你最喜爱的集成开发工具IDE创建一个新工程。我会把我的新工程命名为 `myConfigParser`
刚开始先不要太关注依赖导入和异常捕获这些,你可以先尝试用 `javax``java.io` 包里的标准 Java 扩展来实例化一个解析器。如果你使用了 IDE它会提示你导入合适的依赖。如果没有你也可以在文章稍后的部分找到完整的代码里面就有完整的依赖列表。
```java
Path configPath = Paths.get([System][6].getProperty("user.home"), ".config", "DemoXMLParser");
[File][7] configFile = new [File][7](configPath.toString(), "myconfig.xml");
```
Path configPath = Paths.get(System.getProperty("user.home"), ".config", "DemoXMLParser");
File configFile = new File(configPath.toString(), "myconfig.xml");
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = null;
builder = factory.newDocumentBuilder();
[Document][8] doc = null;
Document doc = null;
doc = builder.parse(configFile);
doc.getDocumentElement().normalize();
```
@ -103,33 +101,32 @@ doc.getDocumentElement().normalize();
从你已经读取的 XML 文档中获取数据,其实就是要先找到一个特定的节点,然后遍历它包含的所有元素。通常我们会使用多个循环语句来遍历节点中的元素,但是为了保持代码可读性,我会尽可能少地使用循环语句:
```java
```
NodeList nodes = doc.getElementsByTagName("window");
for (int i = 0; i < nodes.getLength(); i++) {
 Node mynode = nodes.item(i);
 System.out.println("Property = " + mynode.getNodeName());
       
 if (mynode.getNodeType() == Node.ELEMENT_NODE) {
   Element myelement = (Element) mynode;
             
   System.out.println("Theme = " + myelement.getElementsByTagName("theme").item(0).getTextContent());
   System.out.println("Fullscreen = " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());
   System.out.println("Icon set = " + myelement.getElementsByTagName("icons").item(0).getTextContent());
 }
Node mynode = nodes.item(i);
System.out.println("Property = " + mynode.getNodeName());
if (mynode.getNodeType() == Node.ELEMENT_NODE) {
Element myelement = (Element) mynode;
System.out.println("Theme = " + myelement.getElementsByTagName("theme").item(0).getTextContent());
System.out.println("Fullscreen = " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());
System.out.println("Icon set = " + myelement.getElementsByTagName("icons").item(0).getTextContent());
}
}
```
这段示例代码使用了 `org.w3c.dom.NodeList` 类,创建了一个名为 `nodes``NodeList` 对象。这个对象包含了所有名字匹配字符串 `window` 的子节点,实际上这样的节点只有一个,因为本文的示例配置文件中只配置了一个。
紧接着,它使用了一个 for 循环来遍历 `nodes` 列表。具体过程是:根据节点出现的顺序逐个取出,然后交给一个 `if-then` 子句处理。这个 `if-then` 子句创建了一个名为 `myelement``Element` 对象,其中包含了当前节点下的所有元素。你可以使用例如 `getChildNodes``getElementById` 方法来查询这些元素,项目中还 [记录了][9] 其他查询方法。
紧接着,它使用了一个 `for` 循环来遍历 `nodes` 列表。具体过程是:根据节点出现的顺序逐个取出,然后交给一个 `if-then` 子句处理。这个 `if-then` 子句创建了一个名为 `myelement``Element` 对象,其中包含了当前节点下的所有元素。你可以使用例如 `getChildNodes``getElementById` 方法来查询这些元素,项目中还 [记录了][9] 其他查询方法。
在这个示例中,每个元素就是配置的键。而配置的值储存在元素的内容中,你可以使用 `.getTextContent` 方法来提取出配置的值。
在你的 IDE 中运行代码(或者运行编译后的二进制文件):
```java
```
$ java ./DemoXMLParser.java
Property = window
Theme = Dark
@ -139,8 +136,7 @@ Icon set = Tango
下面是完整的代码示例:
```java
```
package myConfigParser;
import java.io.File;
@ -161,44 +157,44 @@ import org.xml.sax.SAXException;
public class ConfigParser {
        public static void main([String][10][] args) {
                Path configPath = Paths.get([System][6].getProperty("user.home"), ".config", "DemoXMLParser");
                [File][7] configFile = new [File][7](configPath.toString(), "myconfig.xml");
                DocumentBuilderFactory factory =
                DocumentBuilderFactory.newInstance();
                DocumentBuilder builder = null;
               
                try {
                        builder = factory.newDocumentBuilder();
                } catch (ParserConfigurationException e) {
                        e.printStackTrace();
                }
       
                [Document][8] doc = null;
       
                try {
                        doc = builder.parse(configFile);
                } catch (SAXException e) {
                        e.printStackTrace();
                } catch ([IOException][11] e) {
                        e.printStackTrace();
                }
        doc.getDocumentElement().normalize();
       
        NodeList nodes = doc.getElementsByTagName("window");
        for (int i = 0; i < nodes.getLength(); i++) {
           Node mynode = nodes.item(i);
           [System][6].out.println("Property = " + mynode.getNodeName());
           
           if (mynode.getNodeType() == Node.ELEMENT_NODE) {
               [Element][12] myelement = ([Element][12]) mynode;
public static void main(String[] args) {
Path configPath = Paths.get(System.getProperty("user.home"), ".config", "DemoXMLParser");
File configFile = new File(configPath.toString(), "myconfig.xml");
DocumentBuilderFactory factory =
DocumentBuilderFactory.newInstance();
DocumentBuilder builder = null;
try {
builder = factory.newDocumentBuilder();
} catch (ParserConfigurationException e) {
e.printStackTrace();
}
Document doc = null;
try {
doc = builder.parse(configFile);
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
doc.getDocumentElement().normalize();
NodeList nodes = doc.getElementsByTagName("window");
for (int i = 0; i < nodes.getLength(); i++) {
Node mynode = nodes.item(i);
System.out.println("Property = " + mynode.getNodeName());
if (mynode.getNodeType() == Node.ELEMENT_NODE) {
Element myelement = (Element) mynode;
               [System][6].out.println("Theme = " + myelement.getElementsByTagName("theme").item(0).getTextContent());
               [System][6].out.println("Fullscreen = " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());
               [System][6].out.println("Icon set = " + myelement.getElementsByTagName("icons").item(0).getTextContent());
           } // close if
        } // close for
    } // close method
System.out.println("Theme = " + myelement.getElementsByTagName("theme").item(0).getTextContent());
System.out.println("Fullscreen = " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());
System.out.println("Icon set = " + myelement.getElementsByTagName("icons").item(0).getTextContent());
} // close if
} // close for
} // close method
} //close class
```
@ -206,18 +202,16 @@ public class ConfigParser {
用户时不时地会改变某个偏好项,这时候 `org.w3c.dom` 库就可以帮助你更新某个 XML 元素的内容。你只需要选择这个 XML 元素,就像你读取它时那样。不过,此时你不再使用 `.getTextContent` 方法,而是使用 `.setTextContent` 方法。
```java
```
updatePref = myelement.getElementsByTagName("fullscreen").item(0);
updatePref.setTextContent("1");
[System][6].out.println("Updated fullscreen to " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());  
System.out.println("Updated fullscreen to " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());
```
这么做会改变应用程序内存中的 XML 文档,但是还没有把数据写回到磁盘上。配合使用 `javax``w3c` 库,你就可以把读取到的 XML 内容写回到配置文件中。
```java
```
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer xtransform;
@ -233,8 +227,7 @@ xtransform.transform(mydom, streamResult);
下面是完整的代码,包括更新 XML 的操作:
```java
```
package myConfigParser;
import java.io.File;
@ -259,68 +252,68 @@ import org.xml.sax.SAXException;
public class ConfigParser {
        public static void main([String][10][] args) {
                Path configPath = Paths.get([System][6].getProperty("user.home"), ".config", "DemoXMLParser");
                [File][7] configFile = new [File][7](configPath.toString(), "myconfig.xml");
                DocumentBuilderFactory factory =
                DocumentBuilderFactory.newInstance();
                DocumentBuilder builder = null;
               
                try {
                        builder = factory.newDocumentBuilder();
                } catch (ParserConfigurationException e) {
                        // TODO Auto-generated catch block
                        e.printStackTrace();
                }
       
                [Document][8] doc = null;
       
                try {
                        doc = builder.parse(configFile);
                } catch (SAXException e) {
                        // TODO Auto-generated catch block
                        e.printStackTrace();
                } catch ([IOException][11] e) {
                        // TODO Auto-generated catch block
                        e.printStackTrace();
                }
        doc.getDocumentElement().normalize();
        Node updatePref = null;
//        NodeList nodes = doc.getChildNodes();
        NodeList nodes = doc.getElementsByTagName("window");
        for (int i = 0; i < nodes.getLength(); i++) {
           Node mynode = nodes.item(i);
           [System][6].out.println("Property = " + mynode.getNodeName());
           
           if (mynode.getNodeType() == Node.ELEMENT_NODE) {
               [Element][12] myelement = ([Element][12]) mynode;
public static void main(String[] args) {
Path configPath = Paths.get(System.getProperty("user.home"), ".config", "DemoXMLParser");
File configFile = new File(configPath.toString(), "myconfig.xml");
DocumentBuilderFactory factory =
DocumentBuilderFactory.newInstance();
DocumentBuilder builder = null;
try {
builder = factory.newDocumentBuilder();
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
Document doc = null;
try {
doc = builder.parse(configFile);
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
doc.getDocumentElement().normalize();
Node updatePref = null;
// NodeList nodes = doc.getChildNodes();
NodeList nodes = doc.getElementsByTagName("window");
for (int i = 0; i < nodes.getLength(); i++) {
Node mynode = nodes.item(i);
System.out.println("Property = " + mynode.getNodeName());
if (mynode.getNodeType() == Node.ELEMENT_NODE) {
Element myelement = (Element) mynode;
               [System][6].out.println("Theme = " + myelement.getElementsByTagName("theme").item(0).getTextContent());
               [System][6].out.println("Fullscreen = " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());
               [System][6].out.println("Icon set = " + myelement.getElementsByTagName("icons").item(0).getTextContent());
System.out.println("Theme = " + myelement.getElementsByTagName("theme").item(0).getTextContent());
System.out.println("Fullscreen = " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());
System.out.println("Icon set = " + myelement.getElementsByTagName("icons").item(0).getTextContent());
               updatePref = myelement.getElementsByTagName("fullscreen").item(0);
               updatePref.setTextContent("2");
               [System][6].out.println("Updated fullscreen to " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());          
           } // close if
           
        }// close for
updatePref = myelement.getElementsByTagName("fullscreen").item(0);
updatePref.setTextContent("2");
System.out.println("Updated fullscreen to " + myelement.getElementsByTagName("fullscreen").item(0).getTextContent());
} // close if
}// close for
        // write DOM back to the file
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer xtransform;
// write DOM back to the file
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer xtransform;
        DOMSource mydom = new DOMSource(doc);
        StreamResult streamResult = new StreamResult(configFile);
DOMSource mydom = new DOMSource(doc);
StreamResult streamResult = new StreamResult(configFile);
        try {
                xtransform = transformerFactory.newTransformer();
                xtransform.transform(mydom, streamResult);
        } catch (TransformerException e) {
                e.printStackTrace();
        }
                       
    } // close method
try {
xtransform = transformerFactory.newTransformer();
xtransform.transform(mydom, streamResult);
} catch (TransformerException e) {
e.printStackTrace();
}
} // close method
} //close class
```
@ -328,7 +321,7 @@ public class ConfigParser {
编写配置文件看上去是一个还挺简单的任务。一开始,你可能会用一个简单的文本格式,因为你的应用程序只要寥寥几个配置项而已。但是,随着你引入了更多的配置项,读取或者写入错误的数据可能会给你的应用程序带来意料之外的错误。一种帮助你保持配置过程安全、不出错的方法,就是使用类似 XML 的规范格式,然后依靠你用的编程语言的内置功能来处理这些复杂的事情。
这也正是我喜欢使用 Java 和 XML 的原因。每当我试图读取错误的配置值时Java 就会提醒我。通常,这是由于我在代码中试图获取的节点,并不存在于我期望的 XML 路径中。XML 这种高度结构化的格式帮助了代码保持可靠性,这对用户和开发者来说都是有好处的。
这也正是我喜欢使用 Java 和 XML 的原因。每当我试图读取错误的配置值时Java 就会提醒我。通常,这是由于我在代码中试图获取的节点,并不存在于我期望的 XML 路径中。XML 这种高度结构化的格式帮助了代码保持可靠性,这对用户和开发者来说都是有好处的。
--------------------------------------------------------------------------------
@ -337,7 +330,7 @@ via: https://opensource.com/article/21/7/parsing-config-files-java
作者:[Seth Kenlon][a]
选题:[lujun9972][b]
译者:[lkxed](https://github.com/lkxed)
校对:[校对者ID](https://github.com/校对者ID)
校对:[wxy](https://github.com/wxy)
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出