最新 最热

课前准备---单细胞数据检测SNV(变异、插入、缺失、等位基因连锁)

尽管单个细胞的测序深度有限,但典型的scRNA-seq数据集包含大量细胞。因此,合并来自多个细胞的数据可以有效地增加可测试事件的数量,用于遗传变异和剪接之间的连锁分析。...

2024-09-06
2

兼容Trino Connector,扩展Apache Doris数据源接入能力|Lakehouse 使用手册(四)

Apache Doris 内置支持包括 Hive、Iceberg、Hudi、Paimon、LakeSoul、JDBC 在内的多种 Catalog,并为其提供原生高性能且稳定的访问能力,以满足与数据湖的集成需求。而随着 Apache Doris 用户的增加,新的数据源连接需求也...

2024-09-06
3

为什么Pandas是最流行的Python数据分析库?

本文将从Python生态、Pandas历史背景、Pandas核心语法、Pandas学习资源四个方面去聊一聊Pandas,期望能带给大家一点启发。

2024-09-06
4

空间转录组合作项目分析示例(三)

腾讯云开发者社区是腾讯云官方开发者社区,致力于打造开发者的技术分享型社区。提供专栏,问答,沙龙等产品和服务,汇聚海量精品云计算使用和开发经验,致力于帮助开发者快速成长与发展,营造开放的云计算技术生态圈。...

2024-09-02
2

GEE 教程:如何实现对指定矢量集合的归一化操作(以北京市各区县面积和边长为例)

数据归一化处理是指将数据按照一定的规则进行变换,使数据落入一个特定的区间范围内。数据归一化处理的目的是消除数据之间的量纲差异,同时保留数据的分布特征,以便更好地进行数据分析和建模。...

2024-09-02
1

GENIE3转录组转录因子分析学习

GENIE3 (GEne Network Inference with Ensemble of trees) 是一种基因网络推断算法,用于从基因表达数据中推断出调控网络。GENIE3 的核心思想是通过构建随机森林(或更广泛地讲,树的集合)来预测每个基因的调控因子。具体来...

2024-09-01
1

知识积累---空间数据结合图像分割实现单细胞级解卷积分析

在10X Visium平台上,将组织切片放置在载玻片上,在载玻片上用条形码逆转录物(RT)引物在固定坐标上分析相同大小的spot。在组织渗透过程中,mRNA分子垂直向下扩散到固体表面,并在原位spot内与RT引物局部杂交。进一步提取cDNA...

2024-09-01
2

知识积累---Graph Fourier transform用于复杂器官的空间组学表征和分析

通过SpaGFT识别的ftu不仅仅是细胞聚集的区域,而且反映了基于空间协调的分子特征的细胞和区域活动以及细胞-细胞相互作用。

2024-08-30
2

招联金融基于 Apache Doris 数仓升级:单集群 QPS 超 10w,存储成本降低 70%

在竞争激烈的消费金融市场中,有效利用海量数据、提升业务运营效率是赢得市场的关键。早期招联采用典型的 Lambda 架构提供业务报表、数据运营、个性推荐、风险控制等数据服务,而 Lambda 过多的技术栈也引发了数据孤岛、...

2024-08-29
4

六月惊喜 | 事件分析 Plus 上线

ClkLog 在四月先上线了一版<事件分析>,可以通过元数据的配置,创建并统计自定义事件的数据情况(例如:用户数、触发次数、人均次数)。

2024-08-29
3