技术宅

使用双向lstm+attention进行情感分类

使用双向lstm+attention进行情感分类
情感分析(sentiment analysis)是近年来国内外研究的热点,其任务是帮助用户快速获取、整理和分析相关评价信息,对带有情感色彩的主观性文本进行分析、处理、归纳和推理。情感分类是指根据文本所表达的含义和情感信息将文本划分成褒扬的或贬义的两种或几种类型,是对文本作者倾向性和观点、态度的划分,因此有时也称倾向性分析(opinion analysis)……继续阅读 »

rainforest 11个月前 (03-17) 2033浏览 0评论1个赞

技术宅

cygwin中解决fork出错的问题

cygwin中解决fork出错的问题
cygwin下运行git发现fork出错,主要是dll的指针不对,这样需要rebase才能解决,具体解决办法如下:退出所有的cygwin进程,包括已经注册成服务的crontab service然后打开命令提示符执行:C:\cygwin64\bin\dash.exe -c ‘/usr/bin/rebaseall -v’(dash.……继续阅读 »

rainforest 12个月前 (02-27) 434浏览 0评论0个赞

技术宅

给定一个数字n,输出包含n对括号的所有合法字符串

给定一个数字n,输出包含n对括号的所有合法字符串
所谓n对括号的所有合法字符串即是指:括号能够被合法关闭,比如“()”是一个合法的括号字符串,而“)(”是一个非法的括号字符串。首先我们看怎么样的括号字符串是合法的呢?很容易观察到规律,就是从前到后扫描,右括号的数永远不大于左括号的数,到最后左括号的数和右括号的数是相等的。要考虑输出n对所有的合法的括号字符串,那我们可以用分裂的思路,一个字符串往后加:……继续阅读 »

rainforest 12个月前 (02-23) 505浏览 0评论1个赞

技术宅

用tcmalloc编译python3.7

用tcmalloc编译python3.7
想提升一下python3.7的解释器的内存分配效率,所以想到链接tcmalloc来提升性能,其中遇到一个问题一直编译不过,记录一下解决办法:1、./configure –prefix=some place来生成Makefile2、拷贝libtcmall.a到编译目录2、修改Makefile,在LIBS的地方加上-L. –ltcmall -lstd……继续阅读 »

rainforest 1年前 (2018-11-29) 645浏览 0评论0个赞

技术宅

快速基于elasticsearch搭建一个中文文本检索系统

快速基于elasticsearch搭建一个中文文本检索系统
elasticsearch是一个开源的文本检索系统,调研文本检索时可以基于elasticsearch快速搭建一个检索系统。 1、安装好jdk,可以用jumbo安装2、下载配置好的elasticsearch包:elasticsearch-2.3.5.tar这个安装包里面已经配置好了分词插件,可以很简单的支持中文检索3、解压包,并调用star……继续阅读 »

rainforest 2年前 (2018-08-13) 576浏览 0评论0个赞

技术宅

使用python实现简单的http代理

使用python实现简单的http代理
工作中需要把一个json的结果转化成html页面展示出来,想到的办法是做一个代理服务器,从目标站点上下载json,解析渲染成html后展示。查了一下,用python来做这个事情比较简单:入口代码直接用的python提供的SimpleHTTPserver自己实现Hander具体代码请参考github地址Githup地址:https://gi……继续阅读 »

rainforest 2年前 (2018-07-26) 623浏览 0评论0个赞

万人迷

PaddlePaddle使用预训练的embedding

PaddlePaddle使用预训练的embedding
有的时候,我们希望用少量的数据来训练一个模型,但又希望这个模型有泛化能力。如果直接用少量的数据去训练一个复杂的nn的模型,肯定会严重过拟合,模型会把所有样本都记住,之后就没有任何泛化能力。这种情况下,我们一般先采用大数据预训练的embeding来解决。这篇文章探讨在paddlepaddle里面如何使用预训练的embeding。如果预先的embedi……继续阅读 »

rainforest 2年前 (2018-07-17) 1023浏览 0评论0个赞