使用Python获取股票数据最佳方法是什么?


在本文中,我们将学习使用Python获取股票数据的最佳方法。

我们将使用yfinance Python库从雅虎财经检索当前和历史股票市场价格数据。

安装雅虎财经(yfinance)

雅虎财经是获取股票市场数据最好的平台之一。只需从雅虎财经网站下载数据集,然后使用yfinance库和Python编程访问它。

您可以使用pip安装yfinance,只需打开命令提示符并输入以下语法所示的命令。

语法

pip install yfinance

yfinance库最好的部分是,它是免费使用的,不需要API密钥。

如何获取股票价格的当前数据

我们需要找到我们可以用于数据提取的股票代码。在下面的示例中,我们将显示GOOGL的当前市场价格和前收盘价。

示例

以下程序使用yfinance模块返回市场价格值、前收盘价值和代码值:

import yfinance as yf
ticker = yf.Ticker('GOOGL').info
marketPrice = ticker['regularMarketPrice']
previousClosePrice = ticker['regularMarketPreviousClose']
print('Ticker Value: GOOGL')
print('Market Price Value:', marketPrice)
print('Previous Close Price Value:', previousClosePrice)

输出

执行上述程序将生成以下输出:

Ticker Value: GOOGL
Market Price Value: 92.83
Previous Close Price Value: 93.71

如何获取股票价格的历史数据

通过给出开始日期、结束日期和代码,我们可以获得完整的历史价格数据。

示例

以下程序返回开始日期和结束日期之间的股票价格数据:

# importing the yfinance package
import yfinance as yf

# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'

# setting the ticker value
ticker = 'GOOGL'

# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)

# printing the last 5 rows of the data
print(resultData.tail())

输出

执行上述程序将生成以下输出:

[*********************100%***********************] 1 of 1 completed
            Open      High     Low       Close     Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000

以上示例将检索从**2015-03-01**到2017-03-01的股票价格数据。

如果要同时提取多个代码的数据,请将代码作为空格分隔的字符串提供。

转换数据以进行分析

在上例数据集中,**日期**是数据集的索引,而不是列。在对其进行任何数据分析之前,必须将此索引转换为列。方法如下:

示例

以下程序将列名添加到开始日期和结束日期之间的股票数据:

import yfinance as yf

# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'

# setting the ticker value
ticker = 'GOOGL'

# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)

# Setting date as index
resultData["Date"] = resultData.index

# Giving column names
resultData = resultData[["Date", "Open", "High","Low", "Close", "Adj Close", "Volume"]]

# Resetting the index values
resultData.reset_index(drop=True, inplace=True)

# getting the first 5 rows of the data
print(resultData.head())

输出

执行上述程序将生成以下输出:

[*********************100%***********************] 1 of 1 completed
   Date      Open       High     Low       Close     Adj Close  Volume

0 2015-03-02 28.350000 28.799500 28.157499 28.750999 28.750999 50406000
1 2015-03-03 28.817499 29.042500 28.525000 28.939501 28.939501 50526000
2 2015-03-04 28.848499 29.081499 28.625999 28.916500 28.916500 37964000
3 2015-03-05 28.981001 29.160000 28.911501 29.071501 29.071501 35918000
4 2015-03-06 29.100000 29.139000 28.603001 28.645000 28.645000 37592000

以上转换后的数据与我们从雅虎财经获取的数据相同。

将获得的数据存储到CSV文件中

可以使用**to_csv()**方法将DataFrame对象导出到CSV文件。以下代码将帮助您将数据导出到CSV文件,因为以上转换后的数据已在pandas数据框中。

# importing yfinance module with an alias name
import yfinance as yf

# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'

# setting the ticker value
ticker = 'GOOGL'

# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)

# printing the last 5 rows of the data
print(resultData.tail())

# exporting/converting the above data to a CSV file
resultData.to_csv("outputGOOGL.csv")

输出

执行上述程序将生成以下输出:

[*********************100%***********************] 1 of 1 completed
            Open      High     Low       Close     Adj Close  Volume

Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000

数据可视化

Python的**yfinance**模块是最易于设置、从中收集数据和执行数据分析活动的模块之一。可以使用Matplotlib、Seaborn或Bokeh等包来可视化结果并获取见解。

您甚至可以使用**PyScript**直接在网页上显示这些可视化效果。

结论

在本文中,我们学习了如何使用Python yfinance模块来获取最佳股票数据。此外,我们还学习了如何获取指定期间的所有股票数据,如何通过添加自定义索引和列来进行数据分析,以及如何将这些数据转换为CSV文件。

更新于:2023年1月16日

12K+ 次浏览

启动您的职业生涯

完成课程获得认证

开始学习
广告