用户访问ClickHouse,需要默认的客户端clickhouse-client,但是这个工具不够友好:
- 需要额外安装,并且使用上,不是那么nice
- clickhouse-client其实是clickhouse的软连接,即要么全装,要么不用
啥最普及啊?
答:MySQL基本所有的服务器都装了mysql,注意,这里指的是mysql-client,就是那个让你用命令行连接到MySQL服务的那个命令
ProxySQL是众多MySQL中间件中的佼佼者,一直被Percona推崇,最近他们也放出了支持ClickHouse的版本
因此,今天的话题就是:
ClickHouse+ProxySQL = Using ClickHouse like MySQL
Install
注意下载ClickHouse打头的包
安装依赖
|
|
- 注意
- 支持ClickHouse的ProxySQL版本,只支持Ubuntu 16, Debian 9, CentOS 7, and Fedora 24,其他版本的不要往下看了
启动ProxySQL
|
|
创建ClickHouse用户
- 用户通过MySQL协议,访问ProxySQL,ProxySQL代理请求访问ClickHouse
- 在第一步里,需要一个密码,这个密码不是ClickHouse的,而是访问ProxySQL的
|
|
通过MySQL客户端连接ClickHouse
- ProxySQL默认开启6090端口,来接收用户对ClickHouse的访问
|
|
执行ClickHouse操作
|
|
缺点
- 缺乏clickhouse-client默认的
- SQL格式化
- SQL进度条
- 这2个功能非常之好用,格式化后的SQL非常美观,如果是要发给其他人的SQL,会显得非常专业
- 进度条功能可以明显看到SQL的执行进度,对于明显慢的不能再慢的SQL,可以及时终止掉,防止把集群资源跑满
问题
- ProxySQL目前对后端的ClickHouse支持很弱,必须是本地的ClickHouse,并且,这个ClickHouse不能有密码,目前是写死的,不支持修改
总结
- MySQL方式访问ClickHouse,可以减少ClickHouse对于新手的陌生感,非常值得一试
- ProxySQL还有很多先进的功能,这里没有展开。不确定是否提供了SQL的控制功能,如果有,那简直太好了
Reference
Update
- 调研ProxySQL其实有一个明显的目的,那就是支持可视化方面的需求
- 在github上有非常多的数据可视化项目,如Superset、SQLPad、Metabase、Franchise等,但是只有Superset官方支持了ClickHouse,其他几个都不支持,但是支持MySQL
- 虽然ProxySQL给ClickHouse做了一层包装,可以用MySQL协议访问ClickHouse,但是由于各家具体产品在实际操作过程中的命令不同,导致无法使用
- Metabase
- 执行了一个命令,
select CONCAT(DATE_FORMAT(current_timestamp, '%Y-%m-%d %H:%i:%S.%f' ), ' ', @@system_time_zone);
,这做不到啊
- 执行了一个命令,
- SqlPad
- 获取DB信息的时候,需要查询INFORMATION_SCHEMA.columns,这个也做不到啊
- Franchise直接没跑通
- Redash
- 安装复杂,还要额外依赖PG和Redis,没试
- 我们觉得还是继续用Superset吧。。。。
ProxySQL在ClickHouse里能干吗?
- 之所以讨论这个问题,原因是有的同学对中间件产生了误会,误以为ProxySQL会主动帮你把MySQL的函数转换成ClickHouse的函数
- 然鹅并不是这个意思
- ProxySQL的意义,是提供了一个MySQL协议的通讯方式,具体的SQL还得是ClickHouse自己的
- 说白了,以前你用Python的mysqldb模块,写MySQL专有的函数操作MySQL,现在数据库操作类、方法不用变,把SQL写成ClickHouse专门的函数或者语法,ProxySQL帮你去操作ClickHouse
- 注意一点,如果是mysqldb模块,需要在SQL里用db.tb的方式来指定数据库名