最新 最热

计算机怎么做到存储内容的(一)

上节,我们用逻辑门做了个简单 ALU,它能执行算术(Arithmetic)和逻辑(Logic)运算,ALU 里的 A 和 L 因此得名,当然,算出来之后如果扔掉就没什么意义了。得找个方法存起来,可能还要进行多个连续操作,这就用到计算机内存了。...

2019-08-19
1

动手写一个简单版的谷歌TPU

人工神经网络中的大量乘加计算(譬如三维卷积计算)大多都可以归纳成为矩阵计算。而之前有的各类处理器,在其硬件底层完成的是一个(或多个)标量/向量计算,这些处理器并没有充分利用矩阵计算中的数据复用;而Google TPU V1则是专...

2019-07-31
1

【leetcode刷题】T34-只出现一次的数字 II

Given a non-empty array of integers, every element appears three times except for one, which appears exactly once. Find that single one.

2019-07-18
1

从上到下的系统架构分析方法 - Intel PMU

现代 CPU 大多具有性能监控单元(Performance Monitoring Unit, PMU),用于统计系统中发生的特定硬件事件,例如缓存未命中(Cache Miss)或者分支预测错误(Branch Misprediction)等。同时,多个事件可以结合计算出一些高级指标,例如...

2019-06-04
1

association memory 思路

hebb memory 将当时场景中同时发生的多种不同信息一起记忆下来,以后场景中特点突出的特征都能提取到此记忆,从此记忆推断出其他相关当时情景中的reward等需要的信息,次场景依据记忆的reward进行决策(cem)...

2019-05-31
0

[总结] 与大脑智能相关的重要心理学术语

本文小结一些在心理学领域定义的与大脑智能相关的重要术语:工作记忆、短期记忆、长期记忆、情节缓冲、视觉空间画板、语音回路、排练、以及中央执行。心理学家们把概念玩得很溜。他们的研究,对于实现AGI具有一定的参考...

2019-05-17
0

GPU编程(五): 利用好shared memory

前言 之前在第三章对比过CPU和GPU, 差距非常大. 这一次来看看GPU自身的优化, 主要是shared memory的用法. ----CPU矩阵转置 矩阵转置不是什么复杂的事情. 用CPU实现是很简单的: #include <stdio.h>#include <stdlib.h...

2019-03-06
1

创新AI算法交易:重新定义Bar、标签和平稳性(附代码)

我们经常采用非常简单的方法来预测金融时间序列:利用整个数据集,使用移动窗口生成X和Y,把它分为历史和样本外数据,训练一些机器学习模型映射X到Y并用多空策略进行回测。但我们开始意识到,对于“正常的”静态数据(如图像、文...

2019-02-26
1

memcmp()

函数原型:int memcmp(const void *buf1, const void *buf2, unsigned int count);/* * 比较buf1和buf2的前count的字节*/头文件:#include<string.h>或#include<memory.h>返回值:当buf1<b......

2018-05-28
0

AMD FirePro GPU的DirectGMA 功能

利用Direct Graphic Memory Access(DirectGMA)有效地在AMD FirePro GPU卡之间交换数据 在视觉计算领域中,在应用里使用各种类型的加速器是非常普遍。而如何在加速器之间进行数据交换和通讯是非常关键的。 为...

2018-03-30
1