当前位置 博文首页 > 配置python连接oracle读取excel数据写入数据库的操作流程

    配置python连接oracle读取excel数据写入数据库的操作流程

    作者:万金油的kplin 时间:2021-05-07 17:46

    前提条件:本地已经安装好oracle单实例,能使用plsql developer连接,或者能使用TNS连接串远程连接到oracle集群

    读取excel写入数据库的方式有多种,这里介绍的是使用pandas写入,相对来说比较简便,不需要在读取excel后再去整理数据

    整个过程需要分两步进行:

    一、配置python连接oracle并测试成功

    网上有不少教程,但大部分都没那么详细,并且也没有说明连接单实例和连接集群的区别,这里先介绍连接oracle单实例的方式,后续再补充连接oracle集群方式。

    版本:
    window 10 64位
    python 3.6.8
    cx-Oracle 7.3.0

    安装流程:

    1、使用pip安装操作oracle的包:

    pip install cx_Oracle==7.3.0

    在这里插入图片描述

    2、手动配置cx_Oracle临时客户端:

    注意这里电脑是64位的,使用的即时客户端也是64位的,32位的需要另外到下面的下载地址找一下

    2.1、解压下面的文件

    链接: https://pan.baidu.com/s/12iMCBjKvl-Lao9iOHMT-yw

    提取码: pxmq

    在这里插入图片描述

    oracle即时客户端使用说明:
    https://docs.oracle.com/en/database/oracle/oracle-database/19/lnoci/instant-client.html#GUID-6895DB45-97AA-4738-9959-BD677D610186
    oracle即时客户端下载地址:
    https://www.oracle.com/database/technologies/instant-client/downloads.html

    2.2、放置到D盘某个位置,例如:

    在这里插入图片描述

    2.3、配置环境变量

    控制面板——系统和安全——系统

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    2.4、重启电脑,让新配置的环境变量生效

    2.5、测试配置是否成功

    虽然导入cx_Oracle有红色波浪线,一般认为导入不成功,但这里可以先不管它,直接运行测试代码,没有报错说明没问题。
    如果没有查到数据,也可能是该用户下没有emp表。

    import cx_Oracle
    import os
    
    # 设置环境编码方式,可解决读取数据库中文乱码问题
    os.environ['NLS_LANG'] = 'SIMPLIFIED CHINESE_CHINA.UTF8'
    
    # 用户名/密码@IP:端口/实例名
    conn = cx_Oracle.connect('kplin/12sss3456@192.168.124.102:1521/ORCL')
    
    cursor = conn.cursor()
    
    try:
      sql = 'select * from emp'
      cursor.execute(sql)
      ret = cursor.fetchall()
      print(ret)
      # cursor.commit()
    except Exception as e:
      print(e)
    finally:
      cursor.close()

    在这里插入图片描述

    二、使用pandas读取excel数据,使用sqlalchemy协助写入数据库

    1、安装sqlalchemy,pandas

    这里指定pandas版本是因为最新版的pandas在读写excel的时候会有些奇怪的报错,换成1.1.4版本即可。

    pip install pandas==1.1.4
    pip install sqlalchemy

    2、准备一个excel表,命名为test.xlsx,写入以下测试数据

    在这里插入图片描述

    3、测试读取并写入数据库

    #!/usr/bin/env python
    # -*- coding:utf-8 -*-
    # date: 2021/3/14
    # filename: excel_to_db
    # author: kplin
    
    
    import pandas as pd
    from sqlalchemy import create_engine
    from sqlalchemy import types
    
    
    # conn_string='oracle+cx_oracle://user:pass@host:port/dbname'
    conn_string='oracle+cx_oracle://KPLIN:654321@192.168.124.6:1521/ORCL'
    engine = create_engine(conn_string, echo=False)
    
    df = pd.read_excel('test.xlsx')
    # if_exists有三个可选值,'fail':如果存在该表则报错,'append':如果存在该表则将数据追加到列尾,'replace':如果存在该表则替换
    # df.to_sql('test', con=engine, if_exists='replace')
    
    # 按上面这种写入方式name字段将被写成clob字段类型,
    # 如果我们希望把name改为varchar2类型,怎么做?
    # 我们可以利用sqlalchemy的types把name指定为varchar2()类型
    len = df.name.str.len().max()
    df.to_sql('test', engine, if_exists='replace', dtype={'name': types.VARCHAR(len)})
    
    rows = engine.execute("SELECT * FROM TEST").fetchall()
    
    print(rows)
    js