Python使用RethinkDB总结

数据库 2024/4/27 佚名

3 2 1

和 MongoDB 类似 RethinkDB 是一个主要用来存储 JSON 文档的数据库引擎（MongoDB 存储的是 BSON），可以轻松和多个节点连成分布式数据库，非常好用的查询语言以及支持表的 joins 和 group by 操作等。
昨天试玩了一下 RethinkDB，在一台虚拟机上测试，插入2500万行记录性能比较稳定，维持在 1.5K 行到 2K 行每秒之间，RethinkDB 的数据分片（sharding）功能非常简单，一个点击就可以完成。下面的安装和测试在 Ubuntu 12.04.4 LTS Server 版本上完成。
加入 RethinkDB 官方源后安装：
复制代码代码如下:$ sudo apt-get install python-software-properties
$ sudo add-apt-repository ppa:rethinkdb/ppa
$ sudo apt-get update
$ sudo apt-get install rethinkdb
拷贝一个例子配置文件后修改 bind 部分以便可以从其他机器访问：
复制代码代码如下:$ cd /etc/rethinkdb/
$ sudo cp default.conf.sample instances.d/default.conf

$ sudo vi instances.d/default.conf
...
# bind=127.0.0.1
bind=0.0.0.0
...
启动 rethinkdb：
复制代码代码如下:$ sudo /etc/init.d/rethinkdb start
rethinkdb: default: Starting instance. (logging to `/var/lib/rethinkdb/default/data/log_file')
访问 http://192.168.2.39:8080/ 就可以看到 rethinkdb 的管理界面了：

如果不喜欢在命令行工作，web 界面还提供了 Data Explorer 在线查询工具，支持语法高亮、在线函数提示等，不用额外查帮助文件。

要用程序的方式和 rethinkdb 打交道的话就需要安装客户端驱动（client drivers），官方支持的驱动有 JavaScript, Ruby 和 Python 3种语言，社区支持的驱动几乎包括了 C, Go, C++, Java, PHP, Perl, Clojure, Erlang 等所有主流编程语言。本人用 Python 多一些，所以这里安装 Python 客户端驱动：
复制代码代码如下:$ sudo apt-get install python-pip
$ sudo pip install rethinkdb
测试一下驱动是否能工作了，如果 import rethinkdb 没有出错基本就可以说明模块安装成功：
复制代码代码如下:$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
> import rethinkdb
>
gene2go.txt 是一个含有基因数据的文本文件，大概1000多万行记录，格式如下：
复制代码代码如下:$ head -2 gene2go.txt
#Format: tax_id GeneID GO_ID Evidence Qualifier GO_term PubMed Category (tab is used as a separator, pound sign - start of a comment)
3702 814629 GO:0005634 ISM - nucleus - Component
写个简单程序把 gene2go.txt 的数据导入到 rethinkdb 里：
复制代码代码如下:#!/usr/bin/python
# -*- coding: UTF-8 -*-

import os, os.path, sys, re, csv, string

def csv2db():
data = csv.reader(open('gene2go.txt', 'rb'), delimiter='\t')
data.next()

    import rethinkdb as r
    r.connect('localhost', 28015).repl()
    r.db('test').table_create('gene2go').run()
    gene2go = r.db('test').table('gene2go')
    for row in data:
        gene2go.insert({
            'tax_id': row[0],
            'GeneID': row[1],
            'GO_ID': row[2],
            'Evidence': row[3],
            'Qualifier': row[4],
            'GO_term': row[5],
            'PubMed': row[6],
            'Category': row[7]
        }).run(durability="soft", noreply=True)

def main():
csv2db()

if __name__ == "__main__":
main()

Python,RethinkDB

标签：

Python,RethinkDB

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

狼山资源网 Copyright www.pvsay.com

评论“Python使用RethinkDB总结”

Python使用RethinkDB总结

暂无“Python使用RethinkDB总结”评论...

www.pvsay.com 狼山资源网

29,905影音资源

44,626技术资源

11,817软件资源

578,645站长资源

最新文章

蔡琴《华纳NO.1 2CD 华纳唱片》[WAV+CUE][8

2024/4/27

刀郎《弹词话本 2020》[FLAC/分轨][300MB]

2024/4/27

镭射效果-《音响感应测试带》[WAV+CUE][579

2024/4/27

群星.1994-星SING交差HITS【滚石】【WAV+CU

2024/4/27

水木年华.2003-3新歌+精丫喜洋洋】【WAV+CU

2024/4/27

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/4/27

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

Python使用RethinkDB总结

Python,RethinkDB

sqlserver、Mysql、Oracle三种数据库的优缺点总结

数据库插入数据之select into from与insert into select区别详解

评论“Python使用RethinkDB总结”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

友情链接

Python使用RethinkDB总结

Python,RethinkDB

sqlserver、Mysql、Oracle三种数据库的优缺点总结

数据库插入数据之select into from与insert into select区别详解

评论“Python使用RethinkDB总结”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存