hive sql有个比较强大的功能就是可以使用外界脚本来完成map/reduce。用法如下:
TRANSFORM(….) USING ‘….’ AS (….)。
USING里面可以使用php脚本来处理,具体使用方法看下面这个例子。
①、建一个表:
hive> CREATE TABLE `member`(
> `id`int,
> `user_name`string,
> `passwd`string
> )
> row format delimited
> fields terminated by "\t"//这句很必要,不然下面的文件导入会导致所有的值都变成null
> stored as textfile;②、准备如下数据 /tmp/member.dat
1 zhangsan zs1024 2 lisi ls1991 3 wangwu ww2001 4 liumang lm1234 5 linxing lx1990
③、导入数据
hive> load data local inpath '/tmp/member.dat' into table member;
可以看到:
立即学习“PHP免费学习笔记(深入)”;
hive> select * from member; OK 1 zhangsan zs1024 2 lisi ls1991 3 wangwu ww2001 4 liumang lm1234 5 linxing lx1990
数据已经准备好了 ,现在我们相对第三列做一次md5加密。我们使用php脚本来处理,php脚本(/tmp/changePasswd.php)代码如下:
系统易学易懂,用户只需会上网、不需学习编程及任何语言,只要使用该系统平台,只要会打字,即可在线直接完成建站所有工作。本程序适合不懂php环境配置的新手用来在本机调试智能SiteSEO网站优化软件,安装过程极其简单。您的网站地址:http://localhost您的网站后台:登录地址: http://localhost/admin.php密 码: admin服务器套件所包含的软件:nginx-0.7
<?phpwhile(!feof(STDIN)){
$line = rtrim(fgets(STDIN), "\n"); //逐行读取if (empty($line)) continue; //空,跳出当次循环$data = explode("\t", $line); //将切分出来的数组保存起来,下面判断使用foreach($dataas &$val){
$val = md5($val);
}
unset($val);
echo implode("\t", $data) . "\n";
}④、将php脚本加入到hive中。
hive> add file /tmp/changePasswd.php;
⑤、使用php脚本来执行map/reduce
hive> insert overwrite table member
> select TRANSFORM(`id`,`user_name`,`passwd`) using "/usr/bin/php changePasswd.php"
> as (`id`,`user_name`,`passwd`) from member;最后,我们可以看到,passwd那一列的数据已经改变:
hive> select * from member; OK 1 zhangsan d03eed89429cc3006cc279322c2800c5 2 lisi 063401506c9d9f0e49a706e3779b7428 3 wangwu ac5a8109dbbb46c9f69ffd5fc93c11f8 4 liumang fda8b97fd723bdbf6a754812b5ecec27 5 linxing 4035378ace8936e93d95aa77e7e224d4
版权声明:本文为博主原创文章,转载请注明出处。
以上就介绍了hive 使用php脚本来完成map/reduce,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。










