分类 所有 中的文章

[读书]编写高质量的python程序的91个建议(1)

1,理解pythonic(python化)的概念 美胜丑,显胜隐,简胜杂,杂胜乱,平胜陡,疏胜密(以最小,最明显的逻辑单元来写方法) 找到简单问题的一个方法,最好是唯一的方法(正确的解决之道) 难以解释的实现,源自不好的主意;如有非常 棒的主意,它的实现肯定易于解释(一个需求过来,先看自……

阅读全文

ubuntu下mysql的远程访问开启

ubuntu下的linux开启稍微有点麻烦,查了一些资料才搞定,总结一下当作以后的速查表。 1.首先,机器要开启了3306端口 root@iZ94vs9ps2zZ:~# netstat -an | grep 3306 tcp 0 0 0.0.0.0:3306 0.0.0.0:* LISTEN 如果前缀是127.0.0.1:3306,那至少证明没有开启端口,那如何处理呢,接下来看第二步 2.修改mysql 配置文件 cd /etc/mysql 我们查看一……

阅读全文

Git的三道菜,提升你的git水平

最近发现了scrapyd官方的一个bug,在fix的过程中被维护者吐嘈git水平太低了,然后多次commit了一些无用的信息,导致git的树相对混乱,这对于我这个只使用git commit push add的人提了一个醒,平常都只是将git当作一个存代码的地方,从来没有正儿八经的去看这个问题(这个问题……

阅读全文

(10)分布式下的爬虫Scrapy应该如何做-关于动态内容js或者ajax处理(2)

不知不觉这个系列就已经写到了第十篇,如果你跟着前面教程一步一步来,我想你对于scrapy的熟练的程度已经超过了很多人了,这个时候你可能会思考,如果我自己去写这样一个爬虫框架,我会怎么来写,如果是我,我对于队列,数据库的解析又应该怎么来处理呢。如果你能深入到这样的一个地步,我想你一……

阅读全文

ssh免登陆实现

背景 最近在维护mongo集群与spider集群之中,经常来回ssh 登录,非常的不方便,以下的操作可以省去大部分的工作精力 简短命令 我们可以切换到本地的ssh config 目录来重命名,这样就可以不用输入ip了 cd ~/.ssh/ vim config 结果展示 Host mongo001 HostName 192.168.8.4 Host mongo002 HostName 192.168.8.5 Host mongo003 HostName 192.168.8.6 免登录 1.在A机下生成公钥/私钥对 [hadoop@wang-PC ~]$ ssh-keygen -t rsa -P……

阅读全文

基于scrapy可见可得的爬虫工具arachnado

效果预览和项目所在 先上Git地址:https://github.com/TeamHG-Memex/arachnado 这个库在去年8月就已经上线了,作者写的东西和整体的UI界面满不错的, 这是从youtube下载下来后上传到youku的演示效果 整体的效果确实真的很不错,基于torna……

阅读全文

[python基础]关于中文编码和解码那点事儿

我们在用python处理中文的时候,或多或少会遇到这样一些错误 常见错误1: SyntaxError: Non-ASCII character '\xe4' in file C 常见错误2: UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128) 毫无疑问,我们在用python2.7.x的时候都会遇到这种问题,我们常规的解法又是怎么样的呢 # coding:utf-8 import requests def print_text(): url = 'http://www.cnblogs.com/' print requests.get(url).text.encode('utf-8') print_text() 首先在文件py文件的头部加上标识cod……

阅读全文

[python基础]关于装饰器

在面试的时候,被问到装饰器,在用的最多的时候就@classmethod ,@staticmethod,开口胡乱回答想这和C#的static public 关键字是不是一样的,等面试回来一看,哇,原来是这样,真佩服我当时厚着脸皮回答的那些问题… OK,先来张图看看装饰器内容: OK,我们……

阅读全文

从.net转型,聊聊最近一些面试,薪资和想法

上一个星期,一篇名为《.net估计要写在你手里了》几乎点燃了整个园子,有人群情激愤了,有人点赞的,有人上去打算喷博主个体无完肤的,总之,这篇博客很成功的引起一些.net 从业者的思考,也包括我。 写那篇博客的人是一名从业6年的.net coder,之所以定义为coder,我在回顾了博主……

阅读全文

最近文章

分类

标签

.net Core 2.1 2016 2017 2018 30 aliyun api async bi,微软大数据 blocking bug C# celery charles chrome chrome headless clang conda coroutine cron cuda dag dagobah darknet debug docker docker-compose dotnet core echo elk epoll error error_code etl flask GC go golang google gpu gunicorn http javascript linux lxml mac message queue mongodb nginx node non-blocking nvidia nvidia-docker opencv oss phantomjs pipeline portia proxy pycharm pytest python python-rq python2.7 python3 remote debug rq scrapy select selenium selenium-web-driver spider splash ssis sync TDD Template Tensorflow test tmux torch ubuntu venv video vscode web web framework webapi whistle xpath yield yolo yolov3 中间件 事件 人生 代理 代码 代码生成器 代码风格 优化 使用 分布式 分析 协程 卓老板聊科技 原理 可变类型 可视化 同步 垃圾回收 培训 基础 处理 多线程 大数据 学习 定时 定时任务 容器 工具 工程 底层 建议 异步 录制 心得 心得,python,培训班 总结 感悟 成长 打断点 技巧 推荐 插件 搜索引擎 播放 效率 数据 数据库 数据清洗 整洁 无头浏览器 日志 机器学习 架构 死亡 测试 消息队列 深度学习 渲染 源码 源码分析 点击 爬虫 状态码 生活 癌症 监听 破解验证码 线程 经验 网关 自我管理 自由 虚拟环境 视觉化爬虫 视频 设计 读书 调度 调试 负载均衡 远程调试 错误 阻塞 阿里云 隧道 隧道代理 集群 非阻塞 项目管理 验证码

友情链接

其它