Beautiful Soup - stripped_strings 属性

方法描述

Tag/Soup 对象的 stripped_strings 属性返回的结果与 strings 属性类似，区别在于它去除了额外的换行符和空格。因此，可以说 stripped_strings 属性会生成一个 NavigableString 对象的生成器，这些对象属于正在使用的对象的内部元素。

语法

Tag.stripped_strings

示例 1

在下面的示例中，在应用剥离后，显示了 BeautifulSoup 对象中解析的文档树中所有元素的字符串。

from bs4 import BeautifulSoup, NavigableString

markup = '''
   <div id="Languages">
      <p>Java</p> <p>Python</p> <p>C++</p>
   </div>
'''
soup = BeautifulSoup(markup, 'html.parser')
print ([string for string in soup.stripped_strings])

输出

['Java', 'Python', 'C++']

与 strings 属性的输出相比，您可以看到换行符和空格被去除了。

示例 2

在这里，我们提取 <div> 标签下每个子元素的 NavigableStrings。

tag = soup.div

navstrs = tag.stripped_strings
for navstr in navstrs:
   print (navstr)

输出

Java
Python
C++

打印页面